Starburst 通过更智能的数据访问和治理来应对 AI 瓶颈
快速阅读: 《硅角度》消息,星爆数据推出增强功能,简化AI模型开发,支持分散数据访问。新增AI“湖畔”架构、AI工作流及自动标记等功能,提升效率与安全性。获花旗战略投资,强化监管领域地位。
星爆数据公司(星爆数据)今日宣布推出一系列增强功能,助力企业更轻松地开发和应用人工智能模型。该公司通过简化对分散在云端、本地系统及混合环境中的数据访问,使这一过程变得更为便捷。此次发布的更新聚焦于星爆企业平台和银河系托管产品的新特性,旨在解决大规模分布式数据访问与管理的复杂性。星爆数据将自身定位于赋能复杂、分布广泛且涉及敏感数据的企业进行AI创新,这些企业并不希望采用全新基础设施或迁移大规模数据集。该公司专注于赋予数据AI能力的工具。“我们的核心竞争优势在于数据访问,能够将所需数据引入湖仓,从而实现高性能与可扩展性,”星爆数据AI产品营销主管尼克·凯斯勒表示。
**“湖畔”概念**
星爆数据的最新更新重点在于启用其所谓的AI“湖畔”,即企业能够在数据所在位置直接使用它,而无需将其复制到集中式存储库中。星爆数据将湖畔定义为AI的准备区域,或者靠近数据湖仓的一个区域,在该区域内数据最为完整、成本效益最高且受治理保护。该公司的新湖畔AI架构结合了AI就绪工具与开放数据湖仓模型,允许企业在保持敏感或受监管数据原地不动的情况下试验、训练和部署AI系统。
**星爆AI工作流**
星爆AI工作流通过更轻松地将非结构化数据转化为向量嵌入来加速AI应用开发。这是一种机器学习技术,可以将数据转换为数值表示,捕捉不同数据点间的含义与关系,而无需显式的关键词。工作流利用SQL管理提示和模型并执行治理策略。星爆指出,这些功能完全包含在其平台内,无需依赖外部数据管道。数据存储于Apache Iceberg表中,并有多种第三方向量数据库的连接器可供选择。这意味着用户可以构建依赖于电子邮件、文档和日志等非结构化或半结构化来源的AI功能,而无需移动数据或拼接多个工具。
**与数据对话**
星爆AI代理是一款内置的自然语言界面,允许用户用自然语言与其数据对话。例如,用户可以提问“我们上个季度在欧洲的销售额是多少?”AI代理将在后台识别相关数据并生成SQL查询。“它是自主性的,因为它不仅仅是大型语言模型的包装,而是专注于自然语言对话,”星爆AI/ML产品副总裁马特·富勒说道。“你可以看到它在后台做了什么。”
**自动化标记**
星爆数据正在通过银河系中的AI驱动自动标记功能解决AI项目中最耗时的任务之一。它能在列级别自动扫描敏感数据,如姓名、电子邮件地址和其他个人可识别信息,并对其进行标记,以便应用访问策略。这减少了手动检查的需求,并帮助组织更一致地执行隐私规则。
**新的星爆数据目录**
新的星爆数据目录取代了过时的Hive元存储,并提供了更好的Iceberg数据格式支持,这种格式正迅速成为云数据湖的标准。新的目录支持遗留Hive数据和Iceberg表。“Hive不支持现代协议,软件本身存在许多漏洞;这是具有Iceberg原生功能的现代化替代品,”星爆AI/ML产品副总裁马特·富勒表示。“你仍然可以访问你的旧Hive数据和[亚马逊网络服务Inc.]Glue。如果你已经有目录,我们将兼容它。”
**完全托管的Iceberg管道**
完全托管的Iceberg管道现在允许自动表维护,包括文件清理和压缩,以及流式或批处理数据摄取的选项。
**更快的查询**
为了提升大规模部署的性能,星爆数据还推出了一个原生ODBC驱动程序,提高了与商业智能工具(如Salesforce Inc.的Tableau和微软公司的Power BI)的连接速度和可靠性。基于角色的查询路由根据用户的角色将查询路由到正确的计算集群,从而提高速度并优化成本。部署集路由将查询分布在多个集群上,以应对需求高峰并确保弹性。
**战略投资**
星爆数据还透露了花旗集团的战略投资,此举增强了其在高度监管领域的声誉。花旗正在使用星爆数据统一来自165个国家的数据访问,同时保持数据主权。
图片:星爆数据硅谷立方
联合创始人约翰·弗莱尔的消息:“您的支持对我们至关重要,它帮助我们保持内容免费。只需点击一下即可支持我们的使命,提供免费、深入且相关的内容。加入我们的YouTube社区加入包括超过15,000名#Cube校友专家的社区,其中包括亚马逊公司首席执行官安迪·贾西、戴尔科技创始人兼首席执行官迈克尔·戴尔、英特尔首席执行官帕特·格尔辛格等众多名人和专家。
‘立方体是我们行业的重要合作伙伴。你们确实是我们的活动的一部分,我们非常感谢你们的到来,我知道人们也非常欣赏你们创造的内容。’——安迪·贾西”
(以上内容均由Ai生成)