我主持自己的 LLM 的 4 个理由,你也应该这样做

发布时间:2025年2月10日    来源:szf
我主持自己的 LLM 的 4 个理由,你也应该这样做

快速阅读: 据《XDA-开发人员》称,托管自己的大型语言模型(LLM)提供了更高的隐私控制、便携性和定制水平。本地托管避免了依赖外部连接,降低了订阅费用,并允许深度定制和实验。尽管在速度和便捷性方面有所欠缺,但这种自主性对于追求隐私和技术掌控的用户极具吸引力。

无论你喜欢与否,大型语言模型越来越多地融入互联网、智能手机和个人电脑的技术中。你的办公套件现在集成了通义千问,而Adobe的创意套件也内置了自己的AI助手。但是使用云托管的LLM会带来一些权衡——隐私。如果你注重隐私,自己托管自己的LLM可能是更好的选择。我一直托管我自己版本的Llama 3模型和最近的深海搜索模型,这给了我无与伦比的控制、定制和可用性。这里有四个原因说明为什么托管我自己的LLM模型对我来说是一个重要的转变——也可能对你来说是如此。

**AI想要帮助你:使用LLM的五种创意方式**
不要错过这些AI可能为你节省时间、金钱和麻烦的好机会

**增强的隐私和安全**
我不信任ChatGPT处理敏感信息,你也不应该关闭托管我自己的LLM最有力的理由之一就是隐私。虽然你不能改变几乎每个LLM都从互联网上收集数据并训练在公开信息上的事实,但我不愿意再向其提供更多的个人信息。当我处理机密文件或分析自己的健康记录时,将其上传到ChatGPT是绝对不行的。这不仅仅是关于收集的数据,更是关于控制。我越能将我的个人信息保持在云端之外,就越好。运行我自己的本地托管LLM意味着我可以执行许多相同的操作,而不必让这些模型访问我的私人信息作为训练数据。是的,你甚至可以切断互联网连接,自托管的LLM也能毫无障碍地工作。这种级别的隐私控制是非常宝贵的,特别是对于那些经常处理敏感材料的人来说。

**随时随地访问**
我打赌ChatGPT做不到这个。这就引出了我的下一个话题——便携性。尽管ChatGPT和Claude很好,但只有在你靠近Wi-Fi连接时才能使用它们。如果你在飞行途中工作,或者可能是在信号不稳定的火车上?又或者你在网络连接不佳的咖啡馆里?这些都是不行的。这就是自托管真正发光的地方。例如,就在上周,我在飞往目的地的航班上用MacBook Air启动了深海搜索7B模型,用来头脑风暴一个演示文稿的想法。当然,它没有云中的LLM那么快,但我真的不介意多花几秒钟来头脑风暴想法、做语法检查或帮助我提高语言水平。本地托管的最大好处是我不依赖外部连接就能完成任务。这真是个改变游戏规则的选择。

**成本**
订阅疲劳确实存在。让我们面对现实,没有人愿意为另一个订阅服务付费。尽管ChatGPT的高级层非常好,但几乎所有我个人需要的LLM功能其实并不需要额外的成本。托管我自己的模型非常经济实惠,如果你的使用场景不是太复杂,这可能也是你的正确选择——尤其是考虑到像LM Studio这样的工具使用起来有多容易。虽然像ChatGPT这样的服务的高级层可能会提供更好的性能,但它们通常对大多数日常任务来说并不是必要的。运行我自己的模型完全避免了这些订阅费用,对我来说,这是一个巨大的胜利。更重要的是,资源高效的模型如Llama 3和深海搜索使其成为一个更有吸引力的选择。让我们面对现实,没有人愿意为另一个订阅服务付费。尽管ChatGPT的高级层非常好,但几乎所有我个人需要的LLM功能其实并不需要额外的成本。托管我自己的模型非常经济实惠,如果你的使用场景不是太复杂,这可能也是你的正确选择——尤其是考虑到像LM Studio这样的工具使用起来有多容易。

**学习和定制**
调整AI模型以符合你的喜好。这里就更有趣了。作为一个科技爱好者,深入研究事物对我来说是自然而然的事情。我喜欢理解事物是如何运作的,而自托管LLM给了我这样的机会。托管我自己的LLM让我有机会进行实验并优化特定的使用案例——无论是数据分析、对话还是内容生成。我不是每次调整都能成功,但这是一种很好的学习这些模型如何工作以及根据我的需求塑造它们的方式。自托管提供了无与伦比的定制水平。我不再局限于云服务提供的预设选项,我可以调整我的LLM的行为,更好地符合我的要求。这意味着改变它的对话风格,针对特定任务进行优化,或将它与我日常生活使用的工具集成。实验和改进模型的灵活性正是我所享受的。坦白说,除非你有非常强大的硬件支持,否则在设备上无法实现。但我一直在尝试使用亚马逊的SageMaker进行微调模型。此外,我还花时间构建插件到深海搜索的API中,用于分析我的个人投资和健康数据。虽然我不愿意将这些数据发送到云服务器,但本地访问允许我摆弄LLM模型,以更好地适应我的使用情况。这种动手操作不仅富有教育意义,也非常有价值。我构建了自定义脚本,探索了新功能,并微调了模型以给我所需的内容。这种控制感是无价的。自托管提供了无与伦比的定制水平。我不再局限于云服务提供的预设选项,我可以调整我的LLM的行为,更好地符合我的要求。这意味着改变它的对话风格,针对特定任务进行优化,或将它与我日常生活使用的工具集成。实验和改进模型的灵活性正是我所享受的。坦白说,除非你有非常强大的硬件支持,否则在设备上无法实现。但我一直在尝试使用亚马逊的SageMaker进行微调模型。

**为什么自托管LLM对我而言是一个重要的转变**
最终,托管我自己的LLM对我来说是一个重要的转变,提供了云模型无法比拟的控制、隐私和定制水平。它并非完美——特别是在速度和便捷性方面,尤其是在进行深度研究时,存在明显不足,准确度也常常不高。但是能够实验、保护我的数据并拥有一个真正按我的条件工作的AI,这一切都是值得的。如果你重视隐私,喜欢摆弄技术,或者只是想要一个更个性化的AI体验,自托管可能也是最适合你的选择。

(以上内容均由Ai生成)

关键词: Llm主持理由

你可能还想读

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日
人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

人工智能将导致财富、权力的集中;必须使用人工智能来解决社会挑战:Nilekani

快速阅读: 据《印度教业务线》称,印度联合创始人纳南·尼莱卡尼表示,AI应用于解决实际问题,提升医疗与教育,强调简约设计和持续创新,反对全民基本收入,主张用AI放大人类潜力。 据《亚洲时报》报道,7月27日,纽约,印度信息技术服务巨头Inf […]

发布时间:2025年8月1日