即使是 Google 也在努力平衡快速但昂贵的闪存和便宜但缓慢的硬盘

发布时间:2025年3月27日    来源:szf
即使是 Google 也在努力平衡快速但昂贵的闪存和便宜但缓慢的硬盘

快速阅读: 据《The Register》最新报道,谷歌在其存储系统中结合SSD和HDD,通过自研的L4缓存系统优化数据放置,大幅提升性能。尽管SSD成本下降,但谷歌仍主要依赖HDD,L4利用机器学习动态调整SSD使用策略,平衡成本与性能。

谷歌披露,尽管其存储需求仍主要依赖于传统硬盘驱动器(HDD),但通过自主研发的自动化数据分级系统,其存储系统的整体性能得到了显著提升。作为全球领先的广告与搜索引擎公司,谷歌在周四的一篇博文中坦承,其依然青睐旋转磁盘技术,并对其“Colossus”通用存储平台进行了深入解析。该平台支撑着YouTube、Gmail、谷歌云存储服务以及其他众多应用。

博文指出,“多数数据中心仅配备一个集群,因此只有一个Colossus文件系统,”并进一步强调,“许多Colossus文件系统拥有多个exabyte的存储容量,其中两个文件系统各自超过了10个exabyte的存储容量。”

Colossus运行高效。谷歌的博文提到,其最大的文件系统通常每秒读取吞吐量超过50TB,写入吞吐量超过25TB,而最繁忙的集群则能提供超过6亿次IOPS的读写操作。每天在全球范围内移动1.2 exabyte的数据?谷歌上次在2021年公开介绍Colossus时曾提及,该系统结合了闪存与磁盘存储,将访问频率最高的数据置于闪存磁盘上,从而提升效率并降低延迟。

Colossus依旧会将高需求数据从硬盘(HDD)迁移至固态硬盘(SSD)。新发布的博文特别指出,“如今这一点尤为重要,因为多年来,SSD的价格变得更为经济实惠,使其在我们数据中心中的重要性日益增加。”博文提到:“然而,仅使用SSD的存储成本仍远高于SSD与HDD混合存储的成本。”“挑战在于将正确的数据——即那些I/O次数最多或延迟要求最低的数据——放置在SSD上,同时保持大部分数据在HDD上。”

周四的博文由存储技术负责人拉里·格林菲尔德(Larry Greenfield)与存储软件工程师赛斯·波伦(Seth Pollen)撰写,他们阐述了谷歌用于在固态硬盘(即Flash存储)与硬盘驱动器之间转移数据的工具。这对作者透露,谷歌内部用户能够强制将文件放入闪存,或者采取一种混合方式,即将文件的一个副本放置在SSD上。后者效果不佳,因为谷歌用来存放存储设备的服务器并不总是可用,因此单个文件副本可能无法访问,内部用户因而不得不应对由HDD带来的更高延迟。因此,大多数关于哪种介质最适合数据的决定是由一个名为“L4”的自动缓存系统做出的,格林菲尔德和波伦写道,“动态选择最适合SSD的数据。”

每天在全球范围内移动1.2 exabyte的数据?归档存储进入谷歌云:它会给AWS和Azure带来冲击吗?大红公司、微软推出了面向更主流Oracle用户的Azure数据库服务。苹果、谷歌简化跨云数据传输,或许代价高昂。

根据《The Register》对该博文的解读,L4会在SSD上缓存数据并构建一个索引,列出这些缓存中的数据。“这意味着当应用程序希望读取某些数据时,它首先咨询L4索引服务器。该索引告知客户端数据是否在缓存中,如果是,则客户端从一个或多个SSD中读取数据,”两人写道。如果数据不在缓存中,L4会从HDD读取数据并移至使用SSD的服务器。“L4可以根据数据量在SSD上的放置程度更加积极或保守,”存储技术人员写道。“我们使用机器学习(ML)驱动的算法为每种工作负载选择不同的策略:当数据被写入时插入L4缓存,首次读取后插入,或仅在短时间内第二次读取后插入。”

谷歌在2022年的USENIX会议上详细介绍了其中一些技术。

性能提升,但问题依然存在

格林菲尔德和波伦的博文表示,L4的缓存技术“对于经常读取相同数据的应用程序非常有效,并且大幅提高了我们的IOPS和吞吐量。”他们也承认它有一个“重大弱点”,因为谷歌仍然将新数据写入HDD。“事实证明,还有其他重要的数据类别,L4的读取缓存在这方面不如我们期望的那样节省资源,例如快速写入、读取和删除的数据(如大型批处理作业的中间结果),以及数据库事务日志和其他看到许多小追加的文件。”这类工作负载不适合HDD,这对作者认为“最好直接写入SSD,完全跳过HDD。”

L4还为新文件自动分配存储位置,因为应用程序尚未使用它们,不能假设它们需要提升到充满SSD的缓存中。因此,当应用程序创建新文件时,它们会共享一些信息,例如文件类型,或存储在文件中的数据库列的元数据。“L4利用这些特征将文件分类,并观察每个类别的I/O模式随时间变化,”格林菲尔德和波伦写道。“这些I/O模式驱动不同放置策略的在线模拟,例如‘在SSD上放置一小时’、‘在SSD上放置两小时’或‘不放在SSD上’。基于此模拟,L4为每个类别选择最佳策略。”

这些情况还可以“预测如果SSD容量或多或少的情况下,L4会选择什么样的放置方式。”“因此,我们可以预测使用不同数量的SSD可以从HDD中卸载多少I/O。这些信号驱动新SSD硬件的采购,并为规划者提供调整不同应用程序间SSD容量的方法以最大化效率,”两人写道。

谷歌并非唯一在努力如何最好地融合SSD和HDD的公司:存储硬件供应商以做得好为荣,但不必在Exabyte规模上运营。因此,当他们在四月份的谷歌云Next大会上公布更多关于其存储系统的信息时,他们和你可能会从中受益。

格林菲尔德和波伦建议查看名为“Google Cloud存储的新功能”和“AI超算:掌握你的存储基础设施”的会议,如果你参加拉斯维加斯的聚会的话。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日