阅读设置
20
18
第296章 昏迷 (1/4)
2.3
检索增强生成技术
rag(retrieval-augmented
generation)技术是一种结合了信息检索(retrieval)和文本生
成(generation)的自然语言处理(nlp)方法。核心思想是将传统的检索技术与现代的自然语言
生成技术相结合,以提高文本生成的准确性和相关性。它旨在通过从外部知识库中检索相关信息来
辅助大型语言模型(如
gpt
系列)生成更准确、可靠的回答。
在
rag
技术中,整个过程主要分为三个步骤如图
2.2
所示:索引(
indexing)、检索
(retrieval)和生成(generation)。首先,索引步骤是将大量的文档或数据集合进行预处理,将
其分割成较小的块(c混k)并进行编码,然后存储在向量数据库中。这个过程的关键在于将非结
构化的文本数据转化为结构化的向量表示,以便于后续的检索和生成步骤。接下来是检索步骤,它
根据输入的查询或问题,从向量数据库中检索出与查询最相关的前
k
个
c混k。这一步依赖于高效
的语义相似度计算方法,以确保检索到的
c混k
与查询具有高度的相关性。最后是生成步骤,它将
原始查询和检索到的
c混k
一起输入到预训练的
transformer
模型(如
gpt
或
bert)中,生成最
终的答案或文本。这个模型结合了原始查询的语义信息和检索到的相关上下文,以生成准确、连贯
且相关的文本。
rag
的概念和初步实现是由
douwe
其他最近更新
- 《公子风流世无双》作者:天鬼山的艾晴
- 《这个杀手是赘婿》作者:雨夜徒步
- 《观影:给诸天万界一点点崩铁震撼》作者:沐子休
- 《农家有蓁宝》作者:冰棠要吃松子
- 《快穿之大佬来了,渣渣要倒霉了》作者:微生青烟
- 《四合院:从民国三十年开始!》作者:心雨未霁
- 《四合院:我当兵回来了》作者:搁浅时光
- 《综影视:我不是提线木偶》作者:珈蓝锦年1
- 《小马宝莉之荒原影魔勇闯小马利亚》作者:MYLIMIT
- 《【水官解厄】月麟》作者:月下丝竹
- 《穿越异世之修仙》作者:寂静无诲
- 《斩神,笙笙来也》作者:久啾咪
- 《逆天神鼎》作者:夜郎不大
- 《婚不可待:高冷凤少也折腰》作者:跳楼的可爱多
- 《重生60饥荒年孤女是异能女王》作者:樱挑
- 《娇美人揣崽去逼婚,震惊家属院!》作者:竹苑青青