text-generation-inference：大型语言模型文本推理工具包

文章目录

text-generation-inference：用于大型语言模型文本生成推理的工具包

项目简介

Text Generation Inference (TGI)是一个用于部署和服务大型语言模型(LLMs)的工具包。它能够为众多流行的开源LLMs（如Llama、Falcon、StarCoder、BLOOM、GPT-NeoX等）实现高性能的文本生成。它具备多种功能，例如简单的启动器、生产就绪（带有OpenTelemetry的分布式跟踪、Prometheus指标）、张量并行以在多个GPU上更快地推理、使用Server-Sent Events (SSE)的令牌流、对传入请求的连续批处理以提高总吞吐量、与OpenAIChatCompletion API兼容的消息API等。

核心技术

TGI实现了许多技术特性。在优化架构方面，它可以服务于所有现代模型的优化模型，也能在一定程度上支持其他架构。其量化技术包括bitsandbytes、GPT-Q、EETQ、WQ、Marlin fp8等多种方式。在推理优化方面，针对最流行的架构使用FlashAttention和PagedAttention优化了transformers代码。它还支持多种硬件，像Nvidia、AMD（-rocm）、Inferentia、Intel GPU、Gaudi、Google TPU等。

实践案例

在Hugging Face公司内部，TGI被用于为HuggingChat、推理API和推理端点提供支持。

项目总结

Text Generation Inference是一个功能强大的大型语言模型文本生成推理工具包。它在众多方面有着优秀的表现，无论是多种模型的支持、多种技术特性还是硬件支持等。希望大家能够对这个项目积极留言讨论，分享自己的见解或者使用过程中的经验。

项目地址

GitHub链接直达

数据统计

数据评估

text-generation-inference：大型语言模型文本推理工具包浏览人数已经达到226，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：text-generation-inference：大型语言模型文本推理工具包的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找text-generation-inference：大型语言模型文本推理工具包的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站链氪巴士提供的text-generation-inference：大型语言模型文本推理工具包都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由链氪巴士实际控制，在2024年12月13日上午12:00收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，链氪巴士不承担任何责任。

链氪巴士致力于优质、实用的网络站点资源收集与分享！本文地址https://linkedbus.com/sites/24326.html转载请注明

相关导航

Ollama-快速上手Llama3.3、Mistral、Gemma2等大型语言模型

Ollama是一个轻量级、可扩展的框架，用于在本地机器上构建和运行语言模型。它提供简单的API创建、运行和管理模型，还有预构建模型库，能用于多种应用。支持如Llama3.3等众多模型，可进行模型创建、拉取等操作，有REST API，社区集成丰富，涵盖Web和桌面端众多应用，还有各种编程语言库与之结合，在不同场景发挥作用。

dyc87112/SpringBoot-Learning：SpringBoot基础教程连载

dyc87112/SpringBoot - Learning是一个专注于SpringBoot的项目。教程自2016年开始连载并持续更新，有1.x和2.x版本，后续还会有3.x版本。其目标是打造最好的免费SpringBoot教程，内容丰富，经过多次迭代。有方便的教程目录查看，还能通过多种方式获取学习资料并参与交流社区。这对于想要深入学习SpringBoot的开发者来说是一个不可多得的资源。

Qv2ray-跨平台的V2Ray图形化客户端介绍

Qv2ray是基于Qt5开发的跨平台V2Ray客户端。本文介绍其项目背景、目的、核心技术、实践案例、优势局限等内容。欢迎大家留言讨论。

Typecho-Theme-Aria：一款功能丰富的Typecho主题

Typecho - Theme - Aria是一个GitHub上的开源项目，是一款Typecho主题。它在功能方面有诸多亮点，例如对MathJax、DPlayer等的支持，还包括多种功能的增加、样式优化以及漏洞修复等，经历了多次版本更新，不断完善自身功能。遵循GPL - 2.0 license协议，在GitHub上获得了481颗星和90个分叉，受到不少开发者的关注。

Bob-macOS平台的翻译和OCR软件

Bob是一款macOS平台的翻译和OCR软件。它的翻译功能包括划词翻译、截图翻译等多种形式，还支持多开、自定义插件等特性。OCR功能涵盖截图OCR、静默截图OCR等多种操作，支持离线识别等。它还支持众多文本翻译、文本识别和语音合成服务，是一款功能丰富的软件。

[译]OpenCV中文文档：OpenCV的中文翻译文档项目

[译]OpenCV中文文档项目是OpenCV库的中文翻译文档。OpenCV是开源计算机视觉库，在BSD许可下发布，可免费用于学术和商业。它有C++、Python、Java接口，支持多种操作系统，以优化C/C++编写可多核处理，OpenCL可硬件加速，该中文文档方便中文使用者理解使用OpenCV。