nomic-embed-text 模型介绍

nomic-embed-text 是一个基于 Sentence Transformers 库的句子嵌入模型,专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色,特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入,这些嵌入在语义上非常接近,从而在相似度计算和分类任务中表现优异。

之所以选用这个模型,是因为在Ollama网站查找这个模型,发现它的热度排名第一!

从Ollama网站查找模型::Ollama

可以看到nomic-embed-text 模型排在第一。 

nomic-embed-text 模型实践

下载nomic-embed-text 模型

 命令行下载 

ollama pull nomic-embed-text

python交互下载

import ollama
ollama.pull('nomic-embed-text')

 运行python交互

import ollama

ollama.embed(model='nomic-embed-text', input='十万个冷笑话')

生成了一大堆的embedding数据

ollama.embed(model='nomic-embed-text', input='十万个冷笑话')
EmbedResponse(model='nomic-embed-text', created_at=None, done=None, done_reason=None, total_duration=865235300, load_duration=662310000, prompt_eval_count=6, prompt_eval_duration=None, eval_count=None, eval_duration=None, embeddings=[[0.0032348887, 0.041912135, -0.16705535, -0.026766753, -0.012629486, 0.0064461557, 0.018424895, -0.01439241, -0.0031062262, -0.024956603, -0.046768334, 0.05268035, -0.0029782322, -0.042236425, 0.017630735, -0.076924205, 0.030286735, -0.050218526, -0.0016884268, 0.07788876, 0.01743242, 0.035234887, -0.075580835, -0.018911943, 0.10255985, 0.031716064, 0.017934492, 0.024279783, 0.014747469, 0.02837642, 0.029457958, -0.008466907, -0.041746665, 0.02766424, -0.073201664, -0.018298512, 0.021074101, ......

实践完成!

CherryStudio中使用nomic-embed-text

Cherry Studio 是一个支持多模型服务的桌面客户端,为专业用户而打造,内置 30 多个行业的智能助手,帮助用户在多种场景下提升工作效率。

Cherry Studio支持多种场景应用,不过还是有一些限制,比如画图只能调用硅基流动的服务。

特色功能:多模型对话,可以选中多个模型,对同一个问题就行回答。

使用文档:知识库教程 | CherryStudio

CherryStudio中添加nomic-embed-text

CherryStudio 的模型服务,在Ollama模型设置中,加入nomic-embed-text 模型

创建知识库

CherryStudio知识库中使用,在创建知识库的时候,嵌入模型选nomic-embed-text

然后,进行知识库内容的建立。

比如直接添加文件

添加目录

添加网址

添加网站

添加笔记等。

比如把水浒传上传进行embedding,整个文件较大,embedding需要等待一些时间。

在chat中使用知识库

embedding后,在chat对话中,就可以使用创建好的知识库了。

Logo

助力广东及东莞地区开发者,代码托管、在线学习与竞赛、技术交流与分享、资源共享、职业发展,成为松山湖开发者首选的工作与学习平台

更多推荐