NovaPigeon's Blog

TensorGPT

发表于 2024-05-21 分类于 Paper Reading

Efficient Compression of the Embedding Layer in LLMs based on the Tensor-Train Decomposition.

发表于 2024-05-20 更新于 2024-05-21 分类于 Paper Reading

On the Structural Pruning of Large Language Models.

发表于 2024-05-19 更新于 2024-05-23 分类于 Paper Reading

Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes.

发表于 2024-05-15 分类于 Paper Reading

Faithfully Emulating Large Production Networks.

发表于 2024-05-15 分类于 Paper Reading

Scalable Tail Latency Estimation for Data Center Networks.

发表于 2024-05-15 分类于 Paper Reading

A caching framework for microservice applications.

发表于 2024-05-15 更新于 2024-05-21 分类于 Paper Reading

Efficient and Affordable Post-Training Quantization for Large-Scale Transformers.