01
PUT _inference/sparse_embedding/alibabacloud_ai_search_sparse{"service": "alibabacloud-ai-search","service_settings": {"api_key": "", "service_id": "ops-text-sparse-embedding-001","host": "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com","workspace": "default"}}
POST _inference/alibabacloud_ai_search_sparse{"input": "阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳"}
POST _inference/sparse_embedding/alibabacloud_ai_search_sparse{"input": "阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳"}
02
PUT _inference/text_embedding/alibabacloud_ai_search_embeddings{"service": "alibabacloud-ai-search","service_settings": {"api_key": "", "service_id": "ops-text-embedding-001","host": "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com","workspace": "default"}}
POST _inference/alibabacloud_ai_search_embeddings{"input": "阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳"}
03
PUT _inference/completion/alibabacloud_ai_search_completion{"service": "alibabacloud-ai-search","service_settings": {"host" : "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com","api_key": "{{API_KEY}}","service_id": "ops-qwen-turbo","workspace" : "default"}}
POST _inference/completion/alibabacloud_ai_search_completion{"input": "阿里巴巴(中国)有限公司是什么时候成立的?"}
04
PUT _inference/rerank/alibabacloud_ai_search_rerank{"service": "alibabacloud-ai-search","service_settings": {"api_key": "", "service_id": "ops-bge-reranker-larger","host": "default-j01.platform-cn-shanghai.opensearch.aliyuncs.com","workspace": "default"}}
05
PUT alibaba_sparse{"mappings": {"properties": {"inference_field": {"type": "semantic_text","inference_id": "alibabacloud_ai_search_sparse"}}}}
PUT alibaba_sparse/_bulk{"index": {"_id": "1"}}{"inference_field": "阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳"}{"index": {"_id": "2"}}{"inference_field": "阿里云(Alibaba Cloud Computing Co. Ltd,又名:阿里云计算有限公司)创立于2009年,总部设在杭州,为阿里巴巴集团的数字技术与智能骨干业务,向全球客户提供全方位云服务,包括自有服务器、弹性计算、存储、网络安全、数据库和大数据等服务。"}
我们通过如下的命令来进行搜索:GET alibaba_sparse/_search{"query": {"semantic": {"field": "inference_field","query": "阿里云是什么时候成立的?"}}}
"阿里云(Alibaba Cloud Computing Co. Ltd,又名:阿里云计算有限公司)创立于2009年,总部设在杭州,为阿里巴巴集团的数字技术与智能骨干业务,向全球客户提供全方位云服务,包括自有服务器、弹性计算、存储、网络安全、数据库和大数据等服务。"
"阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳"
GET alibaba_sparse/_search{"query": {"semantic": {"field": "inference_field","query": "阿里巴巴公司的法人是谁?"}}}
POST _inference/completion/alibabacloud_ai_search_completion{"input": "你是一个知识渊博的人.CONTEXT:阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳QUESTION:阿里巴巴公司的法人是谁?"}
POST _inference/completion/alibabacloud_ai_search_completion{"input": "阿里巴巴法定代表是谁?"}
POST _inference/completion/alibabacloud_ai_search_completion{"input": "你是一个知识渊博的人.CONTEXT:阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳QUESTION:阿里巴巴(中国)有限公司是什么时候成立的?"}
PUT alibaba_dense{"mappings": {"properties": {"inference_field": {"type": "semantic_text","inference_id": "alibabacloud_ai_search_embeddings"}}}}
PUT alibaba_dense/_bulk{"index": {"_id": "1"}}{"inference_field": "阿里巴巴(中国)有限公司成立于2007年03月26日,法定代表人蒋芳"}{"index": {"_id": "2"}}{"inference_field": "阿里云 (又名:阿里云计算有限公司)创立于2009年,总部设在杭州,为阿里巴巴集团的数字技术与智能骨干业务,向全球客户提供全方位云服务"}
我们来对这个密集向量索引 alibaba_dense 来进行搜索:
GET alibaba_dense/_search{"query": {"semantic": {"field": "inference_field","query": "Alibaba 的法人是谁?"}}}
GET alibaba_dense/_search{"query": {"semantic": {"field": "inference_field","query": "Aliyun是什么样的公司?"}}}
06
我们知道 semantic_text 字段可以帮我们自动把一大段的文字进行分块,而不需要我们手动去分块。这个是 semantic_text 一个非常大的好处。我们来创建一个叫做 alibaba_dense_large_text 的索引:
PUT alibaba_dense_large_text{"mappings": {"properties": {"inference_field": {"type": "semantic_text","inference_id": "alibabacloud_ai_search_embeddings"}}}}
我们也为这个索引创建一个大的文档:
PUT alibaba_dense_large_text/_doc/1{"inference_field": "阿里巴巴集团简介阿里巴巴集团(Alibaba Group)是一家总部位于中国浙江省杭州市的全球知名科技公司,成立于1999年,由马云及其团队创建。作为一家以科技驱动为核心的企业,阿里巴巴在电子商务、云计算、金融科技、数字媒体、物流等领域拥有广泛布局,成为全球互联网行业的重要参与者。创立背景与早期发展阿里巴巴的诞生始于1999年,当时中国的互联网刚刚兴起。马云和他的团队怀着通过互联网赋能中小企业的愿景,推出了全球批发交易市场阿里巴巴网站(Alibaba.com)。最初,这个平台主要为中小企业提供展示产品和寻找国际买家的机会,帮助中国的制造商走向全球市场。经过几年发展,阿里巴巴迅速崭露头角,成为全球领先的B2B电子商务平台。2003年,阿里巴巴推出了面向个人消费者的C2C平台淘宝网(Taobao),迅速吸引了大量用户。凭借“免费开店”的模式,淘宝在短时间内与其他电商平台展开竞争并取得成功。为了增强用户体验,阿里巴巴在2004年推出了第三方支付平台支付宝(Alipay),解决了在线支付的信任问题,这一创新奠定了中国电子商务快速发展的基础。业务生态与战略布局阿里巴巴通过不断拓展业务,逐步构建了涵盖电商、金融、物流和云计算等领域的多元化生态系统。电子商务领域作为阿里巴巴的核心业务,电子商务包括淘宝、天猫(Tmall)和全球速卖通(AliExpress)等平台。其中,淘宝以满足个人消费者需求为主,天猫则面向品牌和企业,提供高品质的商品和服务。全球速卖通致力于连接海外买家与中国卖家,在国际市场上影响力日益增强。云计算与大数据阿里云(Alibaba Cloud)是阿里巴巴集团的核心技术部门,成立于2009年,提供云计算服务、人工智能解决方案和大数据技术支持。如今,阿里云已成为全球领先的云服务提供商,为企业数字化转型提供支撑。金融科技支付宝的母公司蚂蚁集团是阿里巴巴金融科技布局的重要组成部分。通过支付宝,阿里巴巴为用户提供线上支付、理财、贷款等服务,推动了中国无现金社会的发展。物流与供应链菜鸟网络(Cainiao Network)成立于2013年,致力于优化物流效率,构建覆盖全球的智能物流网络。菜鸟的技术和平台能力提升了电商物流服务的速度和可靠性。数字媒体与娱乐阿里巴巴还在数字媒体领域积极布局,包括优酷、阿里影业和虾米音乐等,推动内容生态的建设。此外,集团通过投资文化创意产业和拓展体育事业,进一步丰富了品牌内涵。国际化与创新近年来,阿里巴巴不断加快国际化步伐,旨在成为全球消费者与企业的桥梁。集团通过并购和合作,扩展了其在东南亚、欧洲和北美等市场的业务。例如,通过收购Lazada,阿里巴巴增强了其在东南亚地区的电商影响力。此外,阿里巴巴还积极探索新技术,包括人工智能、区块链和物联网。这些技术的应用不仅优化了集团的现有业务,还为未来的创新奠定了基础。企业文化与社会责任阿里巴巴的企业文化以“让天下没有难做的生意”为核心使命,鼓励员工创新和协作。马云强调企业的社会责任,并倡导将资源用于公益事业。例如,阿里巴巴基金会支持环境保护、教育发展和扶贫工作,为社会创造长期价值。面临的挑战与未来展望尽管阿里巴巴取得了显著成就,但也面临着国际竞争加剧、行业监管加强和技术创新压力等挑战。为了保持领先地位,阿里巴巴需要在全球范围内持续创新,同时积极适应不同市场的法规和文化。展望未来,阿里巴巴将继续推动科技与商业的融合,助力中小企业和消费者实现更多价值。同时,通过技术研发和全球化布局,阿里巴巴有望在全球数字经济的发展中扮演更加重要的角色。结语作为中国乃至全球最具影响力的互联网公司之一,阿里巴巴的成长历程展现了科技对商业模式的深刻变革。通过不断创新和拓展,阿里巴巴正在为全球经济注入新的活力,也为无数企业和消费者创造了前所未有的机会。未来,阿里巴巴仍将以技术和商业为驱动,为构建更加便捷和高效的数字化世界而努力。"}
上面的文章的字数大概在1000个字左右。
我们可以通过如下的方法来查看写入的文档:
GET alibaba_dense_large_text/_search
从上面,我们可以看出来,semantic_text 字段自动将一个很长文字的文档分块,并分别对它们进行向量化。
希望本文能为您在使用阿里云和 Elasticsearch 进行向量搜索的探索中提供有价值的参考和启发。未来,随着技术的不断演进,我们期待看到更多基于语义理解的智能应用落地,推动搜索技术向更高的层次发展。
/ END /
更多推荐
↙点击阅读原文,了解 Elasticsearch 产品详情!