阅读设置
第277章 延迟 (2/3)
transformer
架构,相较于其他模型,这种架构允许模型在处理长文本时保持较好的性能,同时具有良好的并行
化能力,使得模型的训练和推理速度得到提升。
5.2.1
chatbot
后端
基于先前构建的针对电力
lca
领域的向量知识库构建
chatbot
测试模型性能,主要设计思路是
为了实现检索功能,大致可分为知识库检索功能和在线搜索。
chatbot
功能流程图如图
5.1
所示。
用户通过
chatbot
界面输入他们的问题或请求。对用户输入文本进行清洗,包括去除标点符
号,进行分词等。转化为结构化数据后将预处理后的文本转换为向量形式,以便于机器理解。将向
量化处理后的用户问题构建成搜索向量。使用搜索向量与知识库中已向量化的内容进行匹配,找出
相关的信息。对匹配到的知识库内容进行排序,选择最相关的几个回答候选。为保证性能设置最相
关的问答数量。基于排序和选择的结果,生成回答,将最终确定的回答返回给用户。
对于用户输入的问题语句进行文本预处理,随后将其变成机构化数据后向量化,与先前处理文
献数据类似,因此这里不再赘述。
知识库搜索:
以下是通过
weaviate
在名为“water”的集合中搜索与特定查询文本相近的文档,并返回相
关文档的内容和来源,设置
top_k=3,考虑计算机性能与运行速度,只寻找三个匹配项。
这段代码最终返回一个包含匹配文档内容和来源的列表。
在线搜索:
以下是通过在线搜索引擎在互联网上搜索相关内容,并返回格式化的文档列表,其中包含每个
搜索结果的摘要内容和来源链接的代码,同样设置
top_k=3,返回三个匹配项。
通过
duckduckgo
搜索引擎在互联网上搜索相关内容,并返回格式化的文档列表,其中包含每
个搜索结果的摘要内容和来源链接。代码利用正则表达式提取搜索结果中的摘要、标题和链接信
息,并对结果进行整理和格式化,以便展示给用户。通过这个函数,用户可以通过输入查询来搜索
互联网上的相关信息,并查看摘要和链接。
streamlit
是一个强大的
python
库,主要用于机器学习、数据可视化和
其他最近更新
- 《公子风流世无双》作者:天鬼山的艾晴
- 《这个杀手是赘婿》作者:雨夜徒步
- 《观影:给诸天万界一点点崩铁震撼》作者:沐子休
- 《农家有蓁宝》作者:冰棠要吃松子
- 《快穿之大佬来了,渣渣要倒霉了》作者:微生青烟
- 《四合院:从民国三十年开始!》作者:心雨未霁
- 《四合院:我当兵回来了》作者:搁浅时光
- 《综影视:我不是提线木偶》作者:珈蓝锦年1
- 《小马宝莉之荒原影魔勇闯小马利亚》作者:MYLIMIT
- 《【水官解厄】月麟》作者:月下丝竹
- 《穿越异世之修仙》作者:寂静无诲
- 《斩神,笙笙来也》作者:久啾咪
- 《逆天神鼎》作者:夜郎不大
- 《婚不可待:高冷凤少也折腰》作者:跳楼的可爱多
- 《重生60饥荒年孤女是异能女王》作者:樱挑
- 《娇美人揣崽去逼婚,震惊家属院!》作者:竹苑青青