关于我们 | 联系我们 | 订阅服务 |   邮 箱
 
   
 
 首页  今日要闻 发改新闻 产经新闻 营商环境 一带一路 绿色共享 物价消息 企业债券 债券公告
  中国战略性新兴产业网
  当前位置: 首页 >>  
 
电子报
 
GIS、向量、文字检索......火山引擎ByteHouse集成全场景分析能力
2024-10-12 10:51:56      咸宁新闻网

企业业务场景增多、规模扩大,对于底层数据架构来说,可能也会愈加复杂。

比如,某企业因自身业务发展,需要引入向量检索能力,但前期选型的技术架构并不能直接支持,只能重新引入向量数据库。这意味着,研发团队要维护多个组件,让底层架构非常复杂,不仅带来数据冗余,也给数据运维带来压力,造成整体成本增加。

而火山引擎推出的云原生数据仓库ByteHouse不仅能满足海量数据下高性能分析需求,还通过GIS时空分析、全文检索、Vector向量检索,为分析型数据库加持更多能力,让企业用户用一套架构满足多元化分析需求,节省企业资源人力成本,提升数据效能。

据介绍,ByteHouse以ClickHouse 技术路线为基础,为用户提供极速分析体验,支撑实时数据分析和海量数据离线分析,具备便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性。特别是随着数据量的爆炸性增长,企业对分析性能的要求水涨船高,ByteHouse能更好以应对大规模数据处理需求。

ByteHouse在OLAP引擎上实现了一系列增强,能支撑宽表、星型模型、雪花模型等更复杂的分析模型,且能实现基础模型的范式化建模,具备流批一体、优化器、增强型易聚合等技术特点,已经在实时数仓、用户圈选、行为分析、广告推荐等场景中落地。

image.png

基于全能型的OLAP引擎能力,ByteHouse还集成了适用于不同场景的三大引擎,为用户提供更极致的分析服务。

首先,作为OLAP的ByteHouse在支持结构化数据检索方面具备先天优势,ByteHouse全文检索引擎则补齐了对非结构化、半结构化等数据的快速检索能力,支持商品搜索、知识库搜索、日志分析等场景下对文本数据进行关键字检索,让用户可以构建一体化的数据管理、查询服务,降低运维成本和资源成本。

与行业常见的非结构化数据处理引擎,如ElasticSearch相比,ByteHouse也具备明显优势。在性能层面,相关测试数据显示,当单服务器日志写入量在50MB-200MB/s,每秒写入超过30w记录数的情况下,ByteHouse是ElasticSearch性能的5倍以上。在成本层面,ByteHouse具备更高数据压缩比、消耗更少的CPU资源,在保障高效查询的基础上,还能进一步压缩服务器成本。在稳定性层面,ByteHouse冷热分离机制、负载均衡策略,让数据稳定性更高。

其次,ByteHouse还推出了GIS时空分析引擎,在功能层面,ByteHouse兼容OGC标准,支持导入标准GIS文件格式,目前已支持超过50个主流的空间函数。为了提供更极致的使用体验,ByteHouse还在探索自研优化器适配GIS特性,以及GPU硬件层面优化二维空间函数。通过选取两个关键 GIS 函数ST_DistanceSphere 和 ST_Within,ByteHouse 在优化器、硬件等层面的优化,使其在测试函数的性能上显著超越其他产品。

最后,随着大模型的火热,ByteHouse已支持多种向量检索算法,如HNSW、Flat、IVFFlat、IVFPQ,并且基于vector-centric的思路,构建了高效的执行链路,可以支撑大规模向量检索场景,达到毫秒级的查询延迟。通过开源软件VectorDBBench测试工具,在cohere 1M标准测试数据集上,recall 98的情况下,ByteHouse QPS性能已可以超过专用向量数据库。

“一元化数据、多元化引擎”是ByteHouse的产品理念,旨在通过构建统一的平台为用户提供更丰富的数据分析能力,实现数据效能最大化。通过全文检索引擎、GIS引擎、Vector引擎,ByteHouse让用户在享受OLAP极致性能的同时,无需引入其他架构,就能使用文字检索、地理空间分析、向量检索能力,进一步提升使用体验。

声明:本站作为信息内容发布平台,页面展示内容的目的在于传播更多信息,不代表本站立场;本站不提供金融投资服务,所提供的内容不构成投资建议。如您浏览本站或通过本站进入第三方网站进行金融投资行为,由此产生的财务损失,本站不承担任何经济和法律责任。 市场有风险,投资需谨慎。同时,如果您在 上发现归属您的文字、图片等创作作品被我们使用,表示我们在使用时未能联系到您获取授权,请与我们联系。联系电话:010-63691721。
【本文资讯为广告信息,不代表本网立场】
【期号:】【版面:】【作者:】打印本页
 
相关文章
| 更多>>
没有找到对象346+
关于我们 | 联系我们 | 招 聘 | 网站广告刊例 | 广告刊例 | 招标公告刊例 | 订阅服务 | 版权声明 | 郑重声明 | 中国发展网 | 记者证查询 | 技术产品
 
地址:北京市西城区广安门内大街315号信息大厦B座10层
邮编:100053    传真:010-63691390
Copyright   京ICP备09051002号-1  京公网安备 11010202009735号
举报投诉电话:010-65573925;举报投诉email:xwddwyh@126.com
技术支持:北京紫新报通科技发展有限公司
Baidu
map