不断缩小的决策窗口和更快的数据生成使得实时分析成为一种新兴的热门产品类别。Rockset首席执行官兼联合创始人Venkat Venkataramani表示,现在,随着大型语言模型(LLM)和矢量数据库为企业人工智能铺平了道路,我们突然进入了实时人工智能系统的时代。
(资料图片)
不断缩小的决策窗口和更快的数据生成使得实时分析成为一种新兴的热门产品类别。Rockset首席执行官兼联合创始人Venkat Venkataramani表示,现在,随着大型语言模型(LLM)和矢量数据库为企业人工智能铺平了道路,我们突然进入了实时人工智能系统的时代。
到目前为止,Rockset一直在开发一个关系数据库,使用户能够对大量新输入的数据连续运行SQL查询。从传统数据仓库供应商到实时流处理器,许多大数据开发人员一直难以做到这一点。
Rockset通过在其开放的RocksDB的关键价值商店上构建的一系列功能来满足实时分析需求。Rockset首席技术官兼联合创始人Dhruba Borthakur在Facebook帮助下创建了关键价值商店。这包括Rockset强大的聚合索引功能,但也包括其非结构数据的接收、时间序列优化、查询规划和基于云的架构。
到目前为止,目标是让实时应用程序能够访问通过Kafka管道到达的最新数据。与其他追逐实时分析梦想的数据库公司(Imply、Clickhouse和StarTree)一样,没有任何一项出色的功能可以让你突然成功地在大量传入数据上运行每秒数万次SQL查询。相反,这是一种通过不懈的工程实现的能力。
但在4月份发生了变化,Rockset推出了对数据库中矢量搜索功能的初步支持。新功能使Rockset不仅可以在其数据库中存储和索引向量嵌入,还可以将这些向量嵌入与元数据过滤、关键字搜索和向量相似性得分相结合。
Venkataramani表示,这些新的矢量相关功能将为客户解锁实时人工智能应用,特别关注产品推荐、个性化和欺诈检测。
他说:“这方面以前称为预测分析。能够预测即将发生的事情。但如今,这都是实时人工智能。”
自去年年底ChatGPT出现以来,公司开始重新思考如何以及在哪里应用人工智能。Venkataramani表示,基于神经网络和向量嵌入的新技术和技术正在颠覆五年前被认为是前沿的机器学习方法。
以产品推荐为例,这是一个经过时间考验的数据科学家应用程序。与识别最具预测性的特征和属性、构建自动提取它们的管道,然后在运行时仔细构建机器学习模型来推断消费者偏好的艰苦过程不同,随着LLM的出现,公司现在基本上可以将所有这些数据放入文本文档中,并由神经网络进行分类。
他说:“以前,机器学习模型会试图提取关于你的产品、产品颜色、制造商、产品类别等的属性。”“但现在,你可以给这些人工智能模型和神经网络一个BLOB(表示二进制类型的大对象)的文本。你可以给每个产品一个图像目录,你不需要告诉它‘去标记这些图像,说这是蓝色的,属于同一类。’”
“现在你可以提供用户正在观看的所有产品,人工智能模型可以理解用户的喜好和厌恶,而不必根据特定的属性和规则进行编码。”“因此,你可以为用户提供并构建一个向量,该向量代表了他们有更高机会喜欢或购买的所有潜在产品。”
这大大降低了在生产中使用人工智能的门槛,并使公司能够利用人工智能做更多的事情。他说,理论上,这可以使一家公司对其目录中的10万件商品进行预测分析,而不是将其限制在前1000件商品。
有了人工智能,就好像一些机器人在观察用户的所有行为,并更深入地了解每一种产品,然后在用户出现在网站上时实时构建推荐,而不是一小时后、一天后或一周后。可以个性化的程度已经达到了顶峰,因为现在可以将所有这些自动化。
Rockset不创建矢量嵌入(矢量嵌入是大量非结构化文本或图像数据的浓缩表示)。但它确实允许用户将向量嵌入基本上视为数据库中的另一种数据类型,并对其执行操作,例如相似性搜索。
Venkataramani说: “我们不在乎你用什么模型来获取非结构化数据并将其转化为向量。” “把它想象成另一种数据类型,你的表中的另一列。你现在需要对它们进行相似性搜索。你需要说,给定一个向量,给我找到所有其他更接近我正在搜索的向量。”
假设客户希望识别传入数据流中所有类似雏菊的图像(如果应用在公共安全而不是花园游览,则可以将“雏菊”替换为“枪”或“刀”)。
Venkataramani解释道:“我正在寻找的矢量是一朵雏菊,但这里是用矢量表示的所有其他图像。” “现在你需要一个索引。如果你对整个库进行强力搜索,这个问题需要10天才能得到答案。我希望在100毫秒内完成。你是怎么做到的?”
根据向量嵌入的索引运行机器学习算法,如K-最近邻(KNN)或近似最近邻(ANN),显著加快了对输入数据中雏菊和雏菊相邻图像的识别。
没有人在数据库中寻找这个确切的向量。他们在寻找所有更接近或最接近的向量,这就是索引在数学上比根据数字、字符串、日期或时间构建索引复杂得多的地方。这就是为什么矢量搜索是一种非常不同的功能,这也是Rockset所增加应对实时需求的有力功能。
不断缩小的决策窗口和更快的数据生成使得实时分析成为一种新兴的热门产
标题:那些遥远的星际真的与人类有关事件:中国航天科技集团有限公
来自中央戏剧学院的蔚雨晗是候鸟300戏剧板块《达夫达夫》的演员,她向
创业板指上周创出三年新低后,本周强劲反弹,但场内资金却借反弹离场,
第一,把买回来的小鸡腿洗净,与盐生姜腌制…第二,通过至少四至五小时的
【吉鲁追平亨利】法国队史出场榜洛里145利利安-图拉姆142亨利、吉鲁123
连这个都错了!台军自爆弱点,台军,台海,国防部,解放军,中印边境,解放军
荣耀GS3i智能手表46mm京东百亿补贴活动价低至449元,晒单返10元E卡,最
证券时报网讯,6月17日,商务部消费促进司负责人谈2023年5月我国消费市
极兔速递是一家全球物流服务提供商
1、最小的质数是2。2、质数又称素数。一个大于1的自然数,除了1和它自
全球最大“人造太阳”项目深陷泥潭6月16日消息,据《科学美国人》披露
来为大家解答以上问题,电脑wi-fi破解密码,wifi密码破解电脑版很多人
1、韩莹目前世界排名第25位。2、韩莹来自辽宁,1983年4月29日出生,她
本报讯(记者张宇虹窦晓峰通讯员张崇泽)“检察机关不仅帮我们把孩子的
安徽安庆市正式成立“老年助餐慈善基
记者日前从安庆市民政局获悉,该市慈善会近日设立老年助餐慈善基金,共同守护老年人舌尖上的幸福。该基金专项用于资助城乡社区老年食堂、社
安徽淮北积极落实2022年电网防汛度汛
近日,国网淮北供电公司工作人员来到110千伏中泰变电站开展防汛隐患排查。该公司积极落实2022年防汛度汛措施,提前细化应急预案,推进极端
安徽全椒县完善拓展人力信息资源助企
今年以来,全椒县不断完善拓展人力资源信息库、劳务对接信息库、企业用工需求信息库三库信息资源,已摸排400多家次企业缺工岗位信息1 2万个
宿州市埇桥区柔性引进博士推进乡村振
宿州市埇桥区实施博士汇工程,柔性引进29名博士担任副乡镇长或园区副主任,他们将为加快产业发展、推进乡村振兴强化智力支持。目前,博士专
安徽印发出台全面实施零基预算改革方
为进一步提高财政资源配置效率和资金使用效益,省政府印发《安徽省全面实施零基预算改革方案》,明确从编制2023年预算起,在全省范围内全面
5月份安徽居民消费价格同比上涨2.3%
近日,国家统计局安徽调查总队发布了我省5月份居民消费价格统计数据。统计显示,我省居民消费价格同比上涨2 3%,同比涨幅比上月回落0 4个百分
安徽多种方式引导群众防范非法集资风
合肥地铁1号线、3号线上滚动播放防范非法集资宣传视频,淮南市发布《致老年群众的一封信》……6月份是一年一度防范和处置非法集资宣传月,今
铁路部门持续加大长三角地区运力投放
记者从中国铁路上海局集团有限公司获悉,随着上海疫情防控形势持续向好,为进一步适应旅客出行需要,助力复工复产,铁路部门自6月10日起持续加
安徽六安持续精准施策全力促进工业发
六安市与蔚来汽车签署合作协议,共建智能电动汽车零部件配套产业园区。该园区一期计划2023年上半年投产,建成后将具备年产30万吨铝压铸产能,
安徽淮北全力维护外卖送餐员合法权益
为切实防范化解新业态领域重大风险隐患,强化外卖送餐员权益保障工作,淮北市市场监管局充分发挥职能作用,全力维护外卖送餐员合法权益。淮北
湖南涟源开展专项行动一对一为企业纾
位于涟源市的湖南三合美新材料科技有限公司,两条生产线满负荷运行,生产聚氨酯和岩棉复合板。因产品升级与产能扩充,急需新增两条生产线,
湖南蓝山县进村入户排查整治自建房安
老叔,这栋房屋墙体有开裂痕迹,要维修加固,安全重要!5月20日,蓝山县塔峰镇果木村,党员干部上门开展农村自建房安全隐患排查整治。连日来
一季度湖南万元产值综合能耗同比下降
近日,湖南省工业通信业节能监察中心发布一季度全省六大高耗能行业能源消耗统计监测报告。据该报告,一季度全省146家主要高耗能企业的万元
济南起步区一年来累计签约优质项目11
万里黄河第一隧济南黄河济泺路隧道建成通车,占地4000余亩的新能源乘用车零部件产业园加快施工……记者21日采访获悉,建设实施方案获批复一
山东发布通知启动传统民居保护利用试
省住房城乡建设厅、省财政厅近日联合印发《关于做好传统民居保护利用试点工作的通知》,在全省部署开展传统民居保护利用试点工作。此次试点