Tiiny推口袋AI超算,离线运行大模型

发布时间:2025年12月16日    来源:szf
Tiiny推口袋AI超算,离线运行大模型

快速阅读: 据Tiiny消息,该公司近日推出AI Pocket Lab微型计算机,可在无网、无独显条件下本地运行百亿至千亿参数大模型,整机功耗低于65瓦,获吉尼斯认证为最小同类设备之一。

美国初创企业Tiiny近日推出AI Pocket Lab设备,这是一款可运行大语言模型的微型计算机,支持在无网络连接、无独立显卡的条件下执行本地化推理任务。该设备整机功耗控制在65瓦以内,宣称可离线运行参数规模介于100亿至1200亿之间的大型模型。

据该公司介绍,AI Pocket Lab采用12核ARMv9.2架构处理器,搭配自研异构AI加速模块,提供约190 TOPS算力。系统配备80GB LPDDR5X内存与1TB固态硬盘,体积接近大型移动硬盘,强调便携性与低功耗特性。所有数据处理均在本地完成,旨在降低网络延迟并减少敏感信息外泄风险。

此外,该设备依托两项软件优化技术提升效率:TurboSparse通过选择性激活神经元降低计算开销;PowerInfer则协调CPU与专用神经网络处理器(NPU)协同工作,在有限功耗下逼近服务器级吞吐能力。公司称其无需依赖高性能独立GPU,依靠精细调度即可满足复杂推理需求。

Tiiny方面表示,此举意在应对当前云计算模式带来的依赖性、安全性和可持续性挑战,推动人工智能向个人化、私有化方向发展。该产品同时支持开源生态,提供主流模型及智能体框架的一键部署功能,并计划通过远程更新持续优化性能。不过,关于其实际推理能力与宣称指标的匹配程度,目前尚缺乏第三方验证数据。据悉,该硬件已获吉尼斯世界纪录认证,成为可本地运行百亿参数级模型的最小设备之一。

近日,科技媒体人Efosa Udinmwen通过社交平台推介其内容渠道,建议关注者可通过TikTok获取新闻、产品评测及开箱视频,并通过WhatsApp接收定期更新。

Efosa是一名自由撰稿记者,从事科技领域报道已逾七年。他最初因好奇心涉足该领域,如今则凭借对科技的深厚热情持续深耕。其拥有科学领域的硕士与博士学位,扎实的学术背景为其奠定了严谨的分析思维基础。

(以上内容均由Ai生成)

引用自:TechRadar科技媒体

你可能还想读

迪士尼与OpenAI达成角色授权合作

迪士尼与OpenAI达成角色授权合作

快速阅读: 据迪士尼消息,该公司与OpenAI达成战略合作,投资10亿美元获得Sora平台优先使用权,并授权旗下200多个角色用于粉丝创作短视频。此次合作系好莱坞首次大规模AI合作,以提升制作与营销效率,同时规避肖像权争议。 迪士尼近日宣布 […]

发布时间:2025年12月16日
Studio Lab用AI与机器人重塑电商内容体验

Studio Lab用AI与机器人重塑电商内容体验

快速阅读: 据首尔产业振兴院消息,韩国初创企业Studio Lab推出AI驱动的Gency电商内容自动化平台,整合拍摄机器人与生成式AI,可在30秒内完成商品页制作,显著提升中小商户数字化效率,并计划于2026年进军美日市场。 受全球电商市 […]

发布时间:2025年12月16日
斐济喜来登酒店推出AI虚拟礼宾Koko

斐济喜来登酒店推出AI虚拟礼宾Koko

快速阅读: 据业内消息,斐济喜来登高尔夫海滩度假村近日上线AI虚拟礼宾“Koko”,宾客扫码即可查询圣诞活动、预订餐厅并获取实时信息,此举每年可减少纸张消耗,相当于保护50棵树,同时提升服务效率与互动体验。 斐济喜来登高尔夫海滩度假村近日推 […]

发布时间:2025年12月16日
品牌从禁用转向强制使用生成式AI

品牌从禁用转向强制使用生成式AI

快速阅读: 据机构披露,生成式AI在营销领域的应用不断扩大,但面临商标稀释与版权侵权风险;企业多将其输出作为创作起点,并通过私有化部署或授权协议降低法律不确定性。 近日,生成式人工智能在营销领域的应用日益广泛,其法律边界问题引发关注。法律界 […]

发布时间:2025年12月16日
新泽西AI数据中心激增 监管滞后引关注

新泽西AI数据中心激增 监管滞后引关注

快速阅读: 12月16日消息,受AI算力需求激增推动,新泽西州已跻身全美前五大数据中心市场,但电力承压导致电价上涨,州长推迟能耗监管法案引发争议。同时,新提案要求数据中心使用新增清洁能源并公开能耗计划,以平衡产业发展与公众负担。 近年来,人 […]

发布时间:2025年12月16日
AI用电激增推高能源需求

AI用电激增推高能源需求

快速阅读: 据多家机构披露,MFS投资公司指出,AI发展推高电力需求,加剧电网压力,并重塑能源板块投资价值;其主动管理型ETF已重点布局能源企业,以捕捉AI驱动的结构性机遇。 今年以来,人工智能(AI)已成为2025年投资领域的核心主题之一 […]

发布时间:2025年12月16日
英伟达推开源模型赋能AI智能体

英伟达推开源模型赋能AI智能体

快速阅读: 据金融时报报道,英伟达发布开源大模型Nemotron 3,涵盖Nano、Super和Ultra三个版本,采用混合稀疏专家架构以提升推理吞吐量与多智能体协同能力,并首次全面开放权重与工具,推动其从硬件厂商向AI软件生态延伸。 近日 […]

发布时间:2025年12月16日
Jutro Medical完成3600万欧元A轮融资

Jutro Medical完成3600万欧元A轮融资

快速阅读: 据外媒报道,波兰AI医疗公司Jutro Medical完成2400万欧元融资,使其A轮融资总额达3600万欧元。该公司将利用这笔资金并购诊所、拓展欧洲市场,并深化AI代理开发,以应对基层医护短缺与行政负担问题。 波兰人工智能驱动 […]

发布时间:2025年12月16日