标签:LLM

大型语言模型(LLM)是指包含数千亿(或更多)参数的语言模型,这些参数是在大量文本数据上训练的,例如模型 GPT-3、PaLM、Galactica 和LLaMA。具体来说,LLM 建立 Transformer 架构之上。

自治AI代理:Auto-GPT、BabyAGI、AgentGPT、JARVIS / HuggingGPT

AI 代理可以自主地做到这一点,接受用户输入,在llm的帮助下将其分解为许多小的独立任务并进行处理。它们存储单独的结果,在必要时进行检查,然后将其用作后续步骤的输入。这允许处理更复杂的任务并访问不同的基础模型(语言、代码、视频、语音等)和资源(搜索引擎、公共数据API、计算工具等)。

AI 利器之Transformers Agent

AI的发展现在是一天一个样,之前介绍了一些自治AI代理的项目。而在两天前,Hugging Face 发布了 Transformers Agent,一种利用自然语言从精选工具集合中选择工具并完成各种任务的代理。此举使其与 LangChain 作为构建企业通用人工智能 (AGI) 应用程序的新兴框架直接竞争,因为它很像 LangChain 工具和代理。在这里,将介绍什么是 Transformers Agent 以及它与 LangChain Agent 的比较。

1什么是大语言模型?

大语言模型(英文:Large Language Model,缩写LLM),也称大型语言模型,是一种人工智能模型,指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使用包括书籍、文章、网站和其他来源的广泛数据集进行训练。通过分析数据中的统计模式,大型语言模型可以预测给定输入后最可能出现的单词或短语。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种NLP任务上取得令人印象深刻的表现。

近年来大语言模型的时间线:大型语言模型调查

通过利用大型语言模型 (LLM),可以合并特定领域的数据来有效地解决查询。当处理模型在初始训练期间无法访问的信息(例如公司的内部文档或知识库)时,这变得特别有利。

1什么是LangChain?

LangChain 是一个AI开发功能强大的且免费的框架,经过精心设计,使开发人员能够创建由语言模型(尤其是大型语言模型 LLM)的力量驱动的应用程序。

LangChain 是一个框架,它一直是我作为开发者旅途中的规则改变者。 LangChain 是一个独特的工具,它利用大语言模型(LLMs)的力量为各种使用案例构建应用程序。Harrison Chase 的这个创意于 2022 年 10 月作为开源项目首次亮相。从那时起,它就成为 GitHub 宇宙中一颗闪亮的明星,拥有高达 42,000 颗星,并有超过 800 名开发者的贡献。

LangChain 就像一位大师,指挥着 OpenAI 和 HuggingFace Hub 等 LLM 模型以及 Google、Wikipedia、Notion 和 Wolfram 等外部资源的管弦乐队。它提供了一组抽象(链和代理)和工具(提示模板、内存、文档加载器、输出解析器),充当文本输入和输出之间的桥梁。这些模型和组件链接到管道中,这让开发人员能够轻而易举地快速构建健壮的应用程序原型。本质上,LangChain 是 LLM 交响乐的指挥家。

LangChain 彻底改变了多种应用程序的开发流程,包括聊天机器人、生成问答(GQA)和摘要。通过将来自多个模块的组件无缝链接在一起,LangChain 能够围绕大语言模型的力量创建卓越的应用程序。

LangChain 的真正优势在于它的七个关键模块:

  1. 模型:这些是构成应用程序主干的封闭或开源 LLM
  2. 提示:这些是接受用户输入和输出解析器的模板,这些解析器格式化 LLM 模型的输出。
  3. 索引:该模块准备和构建数据,以便 LLM 模型可以有效地与它们交互。
  4. 记忆:这为链或代理提供了短期和长期记忆的能力,使它们能够记住以前与用户的交互。
  5. :这是一种在单个管道(或“链”)中组合多个组件或其他链的方法。
  6. 代理人:根据输入决定使用可用工具/数据采取的行动方案。
  7. 回调:这些是在 LLM 运行期间的特定点触发以执行的函数。

了解更多:官方文档