首页 要闻 中国 经济 财经 品牌 点评 会展 综合 | 设为首页
中国品牌要闻网-传递资讯的价值打造品牌的影响
您现在的位置:首页/IT互联网/ 正文
【2023云栖】郭瑞杰:阿里云搜索产品智能化升级
来源:
编辑:
时间:2023-11-16

 

本文根据 2023 云栖大会演讲实录整理而成,演讲信息如下:

演讲人:郭瑞杰 | 阿里云资深技术专家、搜索负责人

演讲主题:阿里云搜索产品智能化升级发布

近日在2023云栖大会上,阿里云搜索负责人郭瑞杰对阿里云搜索产品智能化升级发布,在全场景的搜索细分领域,提供智能化产品能力,包括基于大模型的开放搜索(OpenSearch)LLM智能问答版和向量检索版,以及面向日志和文本分析场景的Elasticsearch Serverless版等。
 

基于企业专属大模型的对话式搜索

开放搜索(OpenSearch)LLM智能问答版是一站式SaaS化对话式搜索解决方案,内置通义千问以及第三方开源大语言模型,用户可基于业务数据搭建企业专属模型。产品内部集成了段落切分、向量化模型、向量引擎、检索增强大模型等对话式搜索的全链路能力,并可以做到分钟级PoC,小时级正式上线。与开源大模型相比,有更高的准确率基线,答案准确率提升大概20%,幻觉减少40%。开放搜索做了大量的推理优化,token生成速度提升2-3倍,GPU资源使用量减少50%。

识林是一个专注在制药合规领域进行知识收集整理的平台,为药企提供从药物研发、生产到变更等全生命周期的法律法规检索、咨询服务。在今年上半年,识林基于OpenSearch构建了大语言模型的智能问答体系,现在已经无需用户通过关键词反复的检索,通过浏览法律法规原文获取答案,而是以自然语言的方式向提问,识林平台理解问题意图,通过大模型快速的到最终答案,并清晰的展示参考依据。

同时,阿里云推出了基于开放搜索问答版构建的智能学术论文助手SmartArxiv,支持学术调研、速读论文、方法对比、文献综述等功能,帮助解决学术界“信息过载”的问题。目前已在ModelScope官网创空间上线,用户可免费使用。

https://modelscope.cn/studios/smart_arxiv_opensearch/SmartArXiv

相比开源引擎,向量检索性能提升3倍

开放搜索向量检索版在本次的全新升级中,从原来的PaaS形态演化成了Serverless形态,易用性显著改善。核心引擎升级到新引擎VectorStore,性能大幅提升,支持千亿数据毫秒级响应,实时数据秒级更新,与业界主流开源向量引擎相比检索性能提升3倍以上,内存占用降低到50%。并支持标签+向量混合检索等能力,提供从图像向量化到向量存储查询的端到端图搜场景解决方案。

VectorStore差异化特点是高性能,做了大量的向量检索算法的性能优化,千亿级别向量数据毫秒级查询响应,向量更新秒级可见。做了大量数据压缩优化,支持非全内存加载,更低的成本。作为阿里自研的向量引擎,在淘宝个性化搜索、推荐、多模态搜索,以及近期的各种大模型应用中广泛应用。VectorStore的执行框架基于Havenask引擎,后面也将在Havenask中完整开源。

成本降低70%的Elasticsearch Serverless版

阿里云检索分析服务 Elasticsearch 正式推出兼容开源、按需使用的Serverless产品,用户不再需要手动分配资源,平台会根据业务流量波动,自动调度决定资源的增加或缩减,秒级弹性扩缩,真正实现负载与资源动态匹配的按量付费,减少闲置资源冗余成本支出。基于Indexing Service索引构建服务以及OpenStore存储服务,阿里云从硬件选型、集群架构、内核性能进行了全方位优化,实现写入性能提升150%,单位数据存储成本降低70%。同时,阿里云Easticsearch已集成最新的8.9版本,并基于ESRE组件(Elasticsearch Relevance Engine)提供AI增强能力,包括RRF混合排序算法,第三方模型集成、部署和管理等。

免责声明:本文仅代表作者个人观点,与本网无关。其原创性以及文中陈述文字和内容未经本站证实, 对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺, 请读者仅作参考,并请自行核实相关内容。当事人(单位)如有异议,请参阅《删帖说明》办理。
中国品牌要闻网-传递资讯的价值打造品牌的影响
编辑:综合整理
2024-08-29
评论(0)
编辑:综合整理
2024-06-11
评论(0)
  • CopyRight@ 2005-2022 中国品牌要闻网
  • 工商注册号 430122000189097
  • ICP备案许证:渝ICP备2022012785号