<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">

 <title>gavin's blog</title>
 <link href="https://loredunk.github.io//atom.xml" rel="self"/>
 <link href="https://loredunk.github.io/"/>
 <updated>2026-01-30T05:55:27+00:00</updated>
 <id>https://loredunk.github.io/</id>
 <author>
   <name>g</name>
   <email>chanlovelife@163.com</email>
 </author>

 
 <entry>
   <title>深圳服务器托管机房选型指南：4U显卡服务器托管全攻略</title>
   <link href="https://loredunk.github.io//blog/2026/01/27/shenzhen-idc-colocation-guide/"/>
   <updated>2026-01-27T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2026/01/27/shenzhen-idc-colocation-guide</id>
   <content type="html">&lt;p&gt;最近需要为公司的一台4U显卡服务器寻找托管机房,作为技术小白开始调研深圳的IDC市场。我们的服务器配置是&lt;strong&gt;8张RTX 4090 48GB显卡&lt;/strong&gt;,主要用于内部AI模型训练,不是ToC在线业务。经过一番研究,整理了这份机房选型指南,希望能帮助到有类似需求的朋友。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;一机房等级标准从t1到t4&quot;&gt;一、机房等级标准：从T1到T4&lt;/h2&gt;

&lt;p&gt;在选择机房前,首先要了解国际通用的Tier标准。这是由Uptime Institute制定的数据中心等级认证体系:&lt;/p&gt;

&lt;h3 id=&quot;t1级机房基础型&quot;&gt;&lt;strong&gt;T1级机房(基础型)&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;可用性&lt;/strong&gt;: 99.671%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;年宕机时间&lt;/strong&gt;: 28.8小时&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;: 单路供电,无冗余,维护需要停机&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适用场景&lt;/strong&gt;: 非关键业务,成本敏感型应用&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;t2级机房冗余组件型&quot;&gt;&lt;strong&gt;T2级机房(冗余组件型)&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;可用性&lt;/strong&gt;: 99.741%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;年宕机时间&lt;/strong&gt;: 22小时&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;: 单路供电 + 冗余组件,维护仍需部分停机&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适用场景&lt;/strong&gt;: 一般企业应用&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;t3级机房可维护型--推荐级别&quot;&gt;&lt;strong&gt;T3级机房(可维护型)&lt;/strong&gt; ⭐ &lt;strong&gt;推荐级别&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;可用性&lt;/strong&gt;: 99.982%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;年宕机时间&lt;/strong&gt;: 1.6小时&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;: 双路供电,N+1冗余,可在线维护&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适用场景&lt;/strong&gt;: 关键业务,金融、互联网企业&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;为什么推荐&lt;/strong&gt;: 安全性和性价比的最佳平衡点&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;t4级机房容错型&quot;&gt;&lt;strong&gt;T4级机房(容错型)&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;可用性&lt;/strong&gt;: 99.995%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;年宕机时间&lt;/strong&gt;: 0.4小时&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;: 2N/2(N+1)冗余,任何单点故障不影响运行&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适用场景&lt;/strong&gt;: 银行核心系统,超大型互联网公司&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;成本&lt;/strong&gt;: 通常是T3级的2-3倍&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;二选择机房的关键指标&quot;&gt;二、选择机房的关键指标&lt;/h2&gt;

&lt;p&gt;作为外行,我总结了以下必须关注的指标:&lt;/p&gt;

&lt;h3 id=&quot;1-基础设施指标&quot;&gt;1. &lt;strong&gt;基础设施指标&lt;/strong&gt;&lt;/h3&gt;

&lt;h4 id=&quot;电力系统&quot;&gt;电力系统&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;供电保障&lt;/strong&gt;: 至少双路市电 + UPS + 柴油发电机&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;机柜功率&lt;/strong&gt;: 多卡显卡服务器功耗极高,8×RTX 4090配置整机功耗可达4-5kW,需确认机柜能否提供足够功率&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;PDU配置&lt;/strong&gt;: 是否提供双路PDU(防止单点故障)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;⚠️ 关键问题&lt;/strong&gt;: “机柜标配功率是多少?超出部分如何计费?能否承载5kW以上设备?”&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;网络环境&quot;&gt;网络环境&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;BGP多线接入&lt;/strong&gt;: 电信、联通、移动至少三线(内部训练业务可适度降低要求,单线也可)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;带宽质量&lt;/strong&gt;: 询问实际可用带宽,而非理论值&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;网络延迟&lt;/strong&gt;: 深圳到广州/香港的ping值(通常&amp;lt;10ms为优)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;DDoS防护&lt;/strong&gt;: 是否包含基础防护,防护上限是多少&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;💡 内部训练提示&lt;/strong&gt;: 如果只做模型训练而非在线服务,带宽需求较低(5-20Mbps即可),可在此项节省成本&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;制冷系统&quot;&gt;制冷系统&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;精密空调&lt;/strong&gt;: N+1冗余配置&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;温湿度控制&lt;/strong&gt;: 22-24°C,湿度40-60%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;显卡服务器特别注意&lt;/strong&gt;: 发热量大,需要确认散热能力&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;⚠️ 关键问题&lt;/strong&gt;: “高功耗设备是否需要额外的散热措施?”&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;2-安全与合规指标&quot;&gt;2. &lt;strong&gt;安全与合规指标&lt;/strong&gt;&lt;/h3&gt;

&lt;h4 id=&quot;物理安全&quot;&gt;物理安全&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;门禁系统&lt;/strong&gt;: 至少三重门禁(大楼、机房区、机柜)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;视频监控&lt;/strong&gt;: 7×24小时录像,保存周期≥30天&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;消防系统&lt;/strong&gt;: 气体灭火(七氟丙烷),而非水喷淋&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;实地考察要点&lt;/strong&gt;: 查看门禁记录、监控回放、访客登记流程&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;资质认证&quot;&gt;资质认证&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;必备资质&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;ISP/IDC经营许可证(工信部颁发)&lt;/li&gt;
      &lt;li&gt;ISO 27001信息安全管理体系认证&lt;/li&gt;
      &lt;li&gt;ISO 9001质量管理体系认证&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;加分项&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;等保三级认证(GPU服务器涉及数据处理,强烈建议)&lt;/li&gt;
      &lt;li&gt;PCI DSS(如果涉及支付数据)&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;运维保障&quot;&gt;运维保障&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;运维响应&lt;/strong&gt;: 7×24小时值守,故障响应时间&amp;lt;15分钟&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;硬盘销毁&lt;/strong&gt;: 服务器下架后,是否提供硬盘销毁服务&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;安全审计&lt;/strong&gt;: 是否提供操作日志审计&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;3-服务与管理指标&quot;&gt;3. &lt;strong&gt;服务与管理指标&lt;/strong&gt;&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;远程管理&lt;/strong&gt;: 是否提供IPMI/BMC访问&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;重启服务&lt;/strong&gt;: 提供几次免费远程重启/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;技术支持&lt;/strong&gt;: 是否有专属技术对接人&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;SLA承诺&lt;/strong&gt;: 写入合同的可用性保障和赔偿条款&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;三深圳主要idc机房概览&quot;&gt;三、深圳主要IDC机房概览&lt;/h2&gt;

&lt;p&gt;深圳作为一线城市,IDC资源丰富。以下是几家主流机房的基本信息:&lt;/p&gt;

&lt;h3 id=&quot;1-腾讯云深圳数据中心&quot;&gt;1. &lt;strong&gt;腾讯云深圳数据中心&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T3+/T4级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 南山区、宝安区多个节点&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;腾讯自有机房,技术实力强&lt;/li&gt;
      &lt;li&gt;网络质量优秀,直连骨干网&lt;/li&gt;
      &lt;li&gt;适合有腾讯云生态集成需求的企业&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 高端定价,4U约800-1500元/月(不含带宽)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;联系方式&lt;/strong&gt;: 腾讯云官方销售渠道&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;2-润迅数据中心深圳坂田&quot;&gt;2. &lt;strong&gt;润迅数据中心(深圳坂田)&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T3级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 龙岗区坂田&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;老牌IDC服务商,运营经验20+年&lt;/li&gt;
      &lt;li&gt;电信核心节点,网络稳定&lt;/li&gt;
      &lt;li&gt;适合对电信线路有特殊要求的企业&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 中高端,4U约600-1000元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;网络评价&lt;/strong&gt;: 业内口碑较好,客户服务响应快&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;3-万国数据深圳数据中心&quot;&gt;3. &lt;strong&gt;万国数据深圳数据中心&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T3/T4级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 龙华、南山&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;纳斯达克上市公司,合规性强&lt;/li&gt;
      &lt;li&gt;国际标准建设,适合外资企业&lt;/li&gt;
      &lt;li&gt;等保三级认证,金融级安全&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 高端,4U约1000-1800元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适合场景&lt;/strong&gt;: 对合规和国际标准有要求的企业&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;4-鹏博士深圳数据中心&quot;&gt;4. &lt;strong&gt;鹏博士深圳数据中心&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T3级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 福田、南山&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;老牌运营商背景&lt;/li&gt;
      &lt;li&gt;性价比相对较高&lt;/li&gt;
      &lt;li&gt;BGP多线接入质量稳定&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 中端,4U约500-800元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;网络评价&lt;/strong&gt;: 适合中小企业,成本控制较好&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;5-世纪互联深圳机房&quot;&gt;5. &lt;strong&gt;世纪互联深圳机房&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T3级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 福田区&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;国内最大的第三方IDC服务商之一&lt;/li&gt;
      &lt;li&gt;覆盖全国,异地容灾方便&lt;/li&gt;
      &lt;li&gt;服务标准化程度高&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 中高端,4U约700-1200元/月&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;6-中国电信联通深圳核心机房&quot;&gt;6. &lt;strong&gt;中国电信/联通深圳核心机房&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T3级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;运营商自有机房,网络质量有保障&lt;/li&gt;
      &lt;li&gt;带宽成本相对较低&lt;/li&gt;
      &lt;li&gt;但灵活性可能不如民营IDC&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 4U约400-700元/月(含一定带宽)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适合场景&lt;/strong&gt;: 预算有限,对网络线路单一性要求不高&lt;/li&gt;
&lt;/ul&gt;

&lt;hr /&gt;

&lt;h2 id=&quot;-性价比供应商专题&quot;&gt;🔍 &lt;strong&gt;性价比供应商专题&lt;/strong&gt;&lt;/h2&gt;

&lt;p&gt;如果你的业务是内部训练,对机房等级、网络质量要求可以适度放宽,以下几家性价比供应商值得考虑:&lt;/p&gt;

&lt;h3 id=&quot;7-深圳海域云数据中心-&quot;&gt;7. &lt;strong&gt;深圳海域云数据中心&lt;/strong&gt; 🆕&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: 据了解为T2-T3级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 龙岗/宝安区域&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;相对较新的IDC服务商,价格竞争力强&lt;/li&gt;
      &lt;li&gt;主要服务中小企业和创业团队&lt;/li&gt;
      &lt;li&gt;对高功耗GPU服务器较为友好&lt;/li&gt;
      &lt;li&gt;合同灵活度高,可月付或季付&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 4U约350-600元/月(相比老牌IDC便宜20-40%)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;优势分析&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;✅ &lt;strong&gt;价格优势明显&lt;/strong&gt;: 比润迅、万国数据便宜30-50%&lt;/li&gt;
      &lt;li&gt;✅ &lt;strong&gt;高功耗支持&lt;/strong&gt;: 部分机柜支持6-8kW功率,适合8卡4090配置&lt;/li&gt;
      &lt;li&gt;✅ &lt;strong&gt;合同灵活&lt;/strong&gt;: 不强制年付,可短期试用&lt;/li&gt;
      &lt;li&gt;✅ &lt;strong&gt;沟通效率&lt;/strong&gt;: 小团队运作,决策快,问题响应及时&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;劣势分析&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;❌ &lt;strong&gt;品牌知名度低&lt;/strong&gt;: 成立时间较短,网络公开评价较少&lt;/li&gt;
      &lt;li&gt;❌ &lt;strong&gt;合规资质&lt;/strong&gt;: 等保认证、ISO认证等可能不如大厂完整&lt;/li&gt;
      &lt;li&gt;❌ &lt;strong&gt;抗风险能力&lt;/strong&gt;: 相比上市公司,财务稳定性存疑&lt;/li&gt;
      &lt;li&gt;❌ &lt;strong&gt;SLA保障&lt;/strong&gt;: 赔偿条款可能不如大厂明确和慷慨&lt;/li&gt;
      &lt;li&gt;❌ &lt;strong&gt;技术实力&lt;/strong&gt;: 遇到复杂网络问题时,解决能力可能不如老牌IDC&lt;/li&gt;
      &lt;li&gt;❌ &lt;strong&gt;实地考察必要性&lt;/strong&gt;: 由于信息透明度低,更需要亲自实地考察&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;💡 海域云适合场景&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;内部开发/训练环境,而非生产环境&lt;/li&gt;
  &lt;li&gt;预算紧张的初创团队&lt;/li&gt;
  &lt;li&gt;短期项目(3-6个月)&lt;/li&gt;
  &lt;li&gt;可以接受偶尔断电/断网风险的业务&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;⚠️ 海域云不适合场景&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;在线服务,对可用性要求高(99.9%+)&lt;/li&gt;
  &lt;li&gt;涉及敏感数据,需要严格合规认证&lt;/li&gt;
  &lt;li&gt;金融、医疗等强监管行业&lt;/li&gt;
  &lt;li&gt;需要向客户/投资人展示机房资质的场景&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;🎯 对比总结&lt;/strong&gt;:
如果你的8卡4090服务器是用于&lt;strong&gt;内部模型训练&lt;/strong&gt;,海域云的性价比很有吸引力。建议:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;先实地考察,重点看电力系统和散热能力&lt;/li&gt;
  &lt;li&gt;要求提供现有GPU客户案例&lt;/li&gt;
  &lt;li&gt;签订短期合同(3-6个月),观察稳定性后再续约&lt;/li&gt;
  &lt;li&gt;同时准备备用方案,万一不行可快速切换到润迅或鹏博士&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;8-景安网络深圳节点&quot;&gt;8. &lt;strong&gt;景安网络深圳节点&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T2+/T3级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 宝安区&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;河南景安在深圳的节点&lt;/li&gt;
      &lt;li&gt;性价比导向,主打中小企业市场&lt;/li&gt;
      &lt;li&gt;电力成本相对透明&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 4U约400-650元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;网络评价&lt;/strong&gt;: 郑州总部口碑不错,深圳节点相对较新&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适合场景&lt;/strong&gt;: 对品牌有一定要求但预算有限&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;9-快网深圳机房&quot;&gt;9. &lt;strong&gt;快网深圳机房&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;等级&lt;/strong&gt;: T2+级&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;位置&lt;/strong&gt;: 龙华、光明区&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;深圳本地老牌小型IDC&lt;/li&gt;
      &lt;li&gt;灵活度高,可定制化服务&lt;/li&gt;
      &lt;li&gt;适合单台或少量服务器托管&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考价格&lt;/strong&gt;: 4U约300-550元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;注意事项&lt;/strong&gt;: 机房规模小,需实地考察电力冗余情况&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;10-各类二房东机柜分租商&quot;&gt;10. &lt;strong&gt;各类”二房东”(机柜分租商)&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;运作模式&lt;/strong&gt;: 从大机房批量租柜,再分租给小客户&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;价格优势&lt;/strong&gt;: 可能比直接租赁便宜15-25%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;风险提示&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;⚠️ 合同不规范,维权困难&lt;/li&gt;
      &lt;li&gt;⚠️ 可能存在超售&lt;/li&gt;
      &lt;li&gt;⚠️ 大机房升级/调整时,二房东可能无法及时通知&lt;/li&gt;
      &lt;li&gt;⚠️ 出问题时踢皮球(二房东推给大机房,大机房说不认识你)&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;如何识别&lt;/strong&gt;: 价格明显低于市场价,不提供机房产权证明,联系方式只有个人手机号&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;建议&lt;/strong&gt;: 除非预算极度紧张,否则不推荐&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;四8卡rtx-4090服务器托管的特殊考虑&quot;&gt;四、8卡RTX 4090服务器托管的特殊考虑&lt;/h2&gt;

&lt;p&gt;8卡消费级显卡服务器与数据中心级GPU服务器有所不同,有一些特殊注意事项:&lt;/p&gt;

&lt;h3 id=&quot;1-功耗与散热--最关键&quot;&gt;1. &lt;strong&gt;功耗与散热&lt;/strong&gt; ⚡ &lt;strong&gt;最关键&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;我的配置&lt;/strong&gt;: 8×RTX 4090 48GB + 双路至强/AMD EPYC CPU&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;理论功耗计算&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;RTX 4090单卡TDP: 450W&lt;/li&gt;
      &lt;li&gt;8张显卡: 450W × 8 = 3600W&lt;/li&gt;
      &lt;li&gt;CPU、内存、主板、风扇: 约400-800W&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;整机功耗&lt;/strong&gt;: 4000W - 4500W&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;建议机柜功率&lt;/strong&gt;: ≥6kW(留有余量)&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;实际使用功耗&lt;/strong&gt;: 满载训练时约3800-4200W,空闲时约500-800W&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;⚠️ 重点确认&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;“机柜能否承载5kW以上设备?是否有6-8kW机柜可选?”&lt;/li&gt;
      &lt;li&gt;“高功耗设备是否需要额外散热费用?”&lt;/li&gt;
      &lt;li&gt;“冷通道/热通道是否隔离?精密空调制冷量是否充足?”&lt;/li&gt;
      &lt;li&gt;“是否有其他客户托管过8卡GPU服务器?温度控制效果如何?”&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;散热挑战&lt;/strong&gt;: 8张4090堆叠密度高,散热需求极大,务必确认机房制冷能力&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;2-重量与物理尺寸&quot;&gt;2. &lt;strong&gt;重量与物理尺寸&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;4U服务器重量&lt;/strong&gt;: 通常40-60kg&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;确认事项&lt;/strong&gt;: 机柜承重能力,安装是否需要额外人力&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;3-带宽需求--成本节省重点&quot;&gt;3. &lt;strong&gt;带宽需求&lt;/strong&gt; 💰 &lt;strong&gt;成本节省重点&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;内部训练场景&lt;/strong&gt;: 对外带宽需求很低,5-10Mbps即可满足:
    &lt;ul&gt;
      &lt;li&gt;SSH远程管理: &amp;lt;1Mbps&lt;/li&gt;
      &lt;li&gt;数据集/模型下载: 可以选择夜间低峰期传输&lt;/li&gt;
      &lt;li&gt;训练过程: 基本无外网流量&lt;/li&gt;
      &lt;li&gt;监控指标上报: &amp;lt;1Mbps&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;💡 省钱技巧&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;不要被销售忽悠买大带宽,10Mbps独享足够(可省1500-2000元/月)&lt;/li&gt;
      &lt;li&gt;如果偶尔需要传输大文件(100GB+),可以:
        &lt;ul&gt;
          &lt;li&gt;选择按流量计费而非包月&lt;/li&gt;
          &lt;li&gt;或者用移动硬盘直接到机房拷贝(深圳市内1-2小时可达)&lt;/li&gt;
        &lt;/ul&gt;
      &lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;内网互联&lt;/strong&gt;: 如有多台服务器,确认内网是否免费且千兆/万兆互联&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;4-电力成本--大头支出&quot;&gt;4. &lt;strong&gt;电力成本&lt;/strong&gt; 💰 &lt;strong&gt;大头支出&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;8卡4090实际成本计算&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;假设平均功耗: 4kW(考虑到不会7×24满载训练)&lt;/li&gt;
      &lt;li&gt;每月耗电: 4kW × 24h × 30天 = 2880度&lt;/li&gt;
      &lt;li&gt;电费(按0.9元/度): 2880 × 0.9 = &lt;strong&gt;2592元/月&lt;/strong&gt;&lt;/li&gt;
      &lt;li&gt;电费(按1.0元/度): 2880 × 1.0 = &lt;strong&gt;2880元/月&lt;/strong&gt;&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;⚠️ 关键确认&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;电费是包含在托管费中,还是单独计算?&lt;/li&gt;
      &lt;li&gt;单价是多少?有的机房0.8元/度,有的1.2元/度,差异巨大&lt;/li&gt;
      &lt;li&gt;是按实际功率计费还是按峰值功率?&lt;/li&gt;
      &lt;li&gt;是否有阶梯电价或用电高峰加价?&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;💡 省钱技巧&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;优先选择包电套餐(如”5kW以内包月”,可能更划算)&lt;/li&gt;
      &lt;li&gt;谈判时以年付为筹码,争取电价优惠(0.1元/度的差异一年就是3456元)&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;五成本构成与参考价格&quot;&gt;五、成本构成与参考价格&lt;/h2&gt;

&lt;p&gt;托管成本通常包括以下几部分:&lt;/p&gt;

&lt;h3 id=&quot;1-基础托管费&quot;&gt;1. &lt;strong&gt;基础托管费&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;T3级机房&lt;/strong&gt;: 500-1000元/月/4U&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;T4级机房&lt;/strong&gt;: 1000-2000元/月/4U&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;包含&lt;/strong&gt;: 机柜空间、基础电力(通常2-3kW)、物理安全&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;2-额外电力费&quot;&gt;2. &lt;strong&gt;额外电力费&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;超出基础功率部分&lt;/strong&gt;: 300-500元/kW/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;或按实际用电&lt;/strong&gt;: 0.8-1.2元/度&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;3-带宽费用&quot;&gt;3. &lt;strong&gt;带宽费用&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;独享带宽&lt;/strong&gt;: 50-150元/Mbps/月(电信/联通)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;BGP带宽&lt;/strong&gt;: 80-200元/Mbps/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;95计费&lt;/strong&gt;: 适合流量波动大的场景,可能更划算&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;4-增值服务&quot;&gt;4. &lt;strong&gt;增值服务&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;远程重启&lt;/strong&gt;: 50-100元/次(超出免费次数)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;技术支持&lt;/strong&gt;: 300-500元/小时&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;硬件更换协助&lt;/strong&gt;: 200-500元/次&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;-总成本估算8卡rtx-4090服务器&quot;&gt;&lt;strong&gt;💰 总成本估算(8卡RTX 4090服务器)&lt;/strong&gt;&lt;/h3&gt;

&lt;h4 id=&quot;方案a-t3级老牌机房润迅世纪互联&quot;&gt;&lt;strong&gt;方案A: T3级老牌机房(润迅/世纪互联)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;托管费(包含3kW基础电力): 800元/月&lt;/li&gt;
  &lt;li&gt;额外电力(4kW实际使用 - 3kW包含 = 1kW超出):
    &lt;ul&gt;
      &lt;li&gt;按功率包月: 400元/月&lt;/li&gt;
      &lt;li&gt;或按实际用电(2880度×0.9): 2592元/月&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;带宽(10M独享,内部训练够用): 600元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;合计&lt;/strong&gt;: 1800-4000元/月(取决于电费计费方式)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;推荐指数&lt;/strong&gt;: ⭐⭐⭐⭐ 适合生产环境或对稳定性要求高的场景&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;方案b-性价比机房海域云景安&quot;&gt;&lt;strong&gt;方案B: 性价比机房(海域云/景安)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;托管费(包含2kW基础电力): 500元/月&lt;/li&gt;
  &lt;li&gt;电费(2880度×0.85): 2448元/月&lt;/li&gt;
  &lt;li&gt;带宽(10M): 400元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;合计&lt;/strong&gt;: 3348元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;推荐指数&lt;/strong&gt;: ⭐⭐⭐ 适合内部开发训练,可接受偶尔故障&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;方案c-超性价比快网小机房&quot;&gt;&lt;strong&gt;方案C: 超性价比(快网/小机房)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;托管费: 400元/月&lt;/li&gt;
  &lt;li&gt;电费(2880度×0.80): 2304元/月&lt;/li&gt;
  &lt;li&gt;带宽(5M共享): 200元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;合计&lt;/strong&gt;: 2904元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;推荐指数&lt;/strong&gt;: ⭐⭐ 仅适合短期实验,风险较高&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;-成本优化建议&quot;&gt;&lt;strong&gt;💡 成本优化建议&lt;/strong&gt;&lt;/h4&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;电费是大头&lt;/strong&gt;(占比50-70%),重点谈判电价,0.1元/度差异年省3456元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;不要过度购买带宽&lt;/strong&gt;,内部训练10M足够,可省1500元/月&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;年付谈判&lt;/strong&gt;,通常有8-9折优惠,方案A年付可省2000-4000元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;包电套餐&lt;/strong&gt;: 如果机房提供”5kW包月3000元”这类套餐,比按度计费划算&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;em&gt;注: 以上价格为2026年市场参考,实际价格需联系销售获取报价。&lt;/em&gt;&lt;/p&gt;

&lt;h2 id=&quot;六选择流程与注意事项&quot;&gt;六、选择流程与注意事项&lt;/h2&gt;

&lt;h3 id=&quot;推荐选择流程&quot;&gt;&lt;strong&gt;推荐选择流程&lt;/strong&gt;&lt;/h3&gt;

&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;需求梳理&lt;/strong&gt;
    &lt;ul&gt;
      &lt;li&gt;列出功耗、带宽、安全等级要求&lt;/li&gt;
      &lt;li&gt;确定预算范围&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;初步筛选(线上)&lt;/strong&gt;
    &lt;ul&gt;
      &lt;li&gt;根据等级、位置、价格筛选3-5家机房&lt;/li&gt;
      &lt;li&gt;联系销售,索要详细报价和SLA条款&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;实地考察&lt;/strong&gt; ⭐ &lt;strong&gt;最重要&lt;/strong&gt;
    &lt;ul&gt;
      &lt;li&gt;查看门禁、监控、消防系统&lt;/li&gt;
      &lt;li&gt;观察机房整洁度、走线规范性&lt;/li&gt;
      &lt;li&gt;询问现场工程师日常运维细节&lt;/li&gt;
      &lt;li&gt;查看UPS、空调等设备的运行状态&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;技巧&lt;/strong&gt;: 突然提出查看监控回放,测试真实安全水平&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;参考客户评价&lt;/strong&gt;
    &lt;ul&gt;
      &lt;li&gt;在知乎、V2EX等社区搜索机房口碑&lt;/li&gt;
      &lt;li&gt;询问销售是否可以提供现有客户联系方式(大机房通常可以)&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;合同谈判&lt;/strong&gt;
    &lt;ul&gt;
      &lt;li&gt;SLA条款要具体,包含赔偿标准&lt;/li&gt;
      &lt;li&gt;明确电费、带宽的计费方式&lt;/li&gt;
      &lt;li&gt;约定退出机制和数据销毁流程&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;常见坑点提醒&quot;&gt;&lt;strong&gt;常见坑点提醒&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;❌ &lt;strong&gt;价格陷阱&lt;/strong&gt;: 低价套餐往往功率、带宽严重不足
❌ &lt;strong&gt;超售问题&lt;/strong&gt;: 部分机房网络、电力超售,高峰期性能下降
❌ &lt;strong&gt;合同条款&lt;/strong&gt;: 违约责任不对等,退出成本高
❌ &lt;strong&gt;隐藏费用&lt;/strong&gt;: 上架费、布线费、测试费等未明确
❌ &lt;strong&gt;位置偏远&lt;/strong&gt;: 便宜机房可能在工业区,紧急处理时交通不便&lt;/p&gt;

&lt;h3 id=&quot;加分项考察&quot;&gt;&lt;strong&gt;加分项考察&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;✅ 是否有专属技术对接人(而非共享客服)
✅ 机房是否定期举办客户开放日
✅ 是否提供监控系统API接口
✅ 是否允许自带网络设备(交换机、防火墙)
✅ 是否有成熟的混合云对接方案&lt;/p&gt;

&lt;h2 id=&quot;七问销售的关键问题清单&quot;&gt;七、问销售的关键问题清单&lt;/h2&gt;

&lt;p&gt;准备了一份”灵魂拷问”清单,帮助你获取关键信息:&lt;/p&gt;

&lt;h3 id=&quot;基础问题&quot;&gt;&lt;strong&gt;基础问题&lt;/strong&gt;&lt;/h3&gt;
&lt;ol&gt;
  &lt;li&gt;机房具体地址在哪?是否方便实地考察?&lt;/li&gt;
  &lt;li&gt;是自建机房还是租赁?产权归属如何?&lt;/li&gt;
  &lt;li&gt;Tier等级认证是否有第三方证书?&lt;/li&gt;
  &lt;li&gt;等保定级是多少?证书能否提供查看?&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;技术问题&quot;&gt;&lt;strong&gt;技术问题&lt;/strong&gt;&lt;/h3&gt;
&lt;ol&gt;
  &lt;li&gt;机柜标配功率是多少?我的设备峰值4.5kW,是否需要额外付费?有6kW以上机柜吗?&lt;/li&gt;
  &lt;li&gt;电费如何计算?是包含在托管费还是单独计费?单价多少?按实际用电还是按功率包月?&lt;/li&gt;
  &lt;li&gt;网络是BGP多线吗?具体是哪几家运营商?(内部训练可接受单线)&lt;/li&gt;
  &lt;li&gt;提供几个IP地址?是否支持IPv6?&lt;/li&gt;
  &lt;li&gt;到广州、香港、北京的网络延迟分别是多少?&lt;/li&gt;
  &lt;li&gt;有没有托管过8卡GPU服务器的案例?散热效果如何?&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;安全问题&quot;&gt;&lt;strong&gt;安全问题&lt;/strong&gt;&lt;/h3&gt;
&lt;ol&gt;
  &lt;li&gt;门禁系统是几级?我能否获得机柜的独立门禁权限?&lt;/li&gt;
  &lt;li&gt;监控录像保存多久?我能否调取查看?&lt;/li&gt;
  &lt;li&gt;消防系统是什么类型?是否有定期演练?&lt;/li&gt;
  &lt;li&gt;硬盘销毁服务如何收费?流程是怎样的?&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;服务问题&quot;&gt;&lt;strong&gt;服务问题&lt;/strong&gt;&lt;/h3&gt;
&lt;ol&gt;
  &lt;li&gt;提供几次免费重启/月?重装系统是否收费?&lt;/li&gt;
  &lt;li&gt;故障响应时间承诺是多少?写入SLA吗?&lt;/li&gt;
  &lt;li&gt;是否提供7×24小时电话支持?&lt;/li&gt;
  &lt;li&gt;我能否远程访问IPMI?是否限制IP白名单?&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;商务问题&quot;&gt;&lt;strong&gt;商务问题&lt;/strong&gt;&lt;/h3&gt;
&lt;ol&gt;
  &lt;li&gt;最短合同期是多久?年付有折扣吗?电价年付有优惠吗?&lt;/li&gt;
  &lt;li&gt;退出机制如何?是否需要提前通知?违约金多少?&lt;/li&gt;
  &lt;li&gt;能否提供2-3个现有GPU服务器托管客户的联系方式供参考?&lt;/li&gt;
&lt;/ol&gt;

&lt;h2 id=&quot;八海域云深度评价值得冒险吗&quot;&gt;八、海域云深度评价：值得冒险吗?&lt;/h2&gt;

&lt;p&gt;鉴于你提到了海域云,我专门对这家机房做了深度分析。&lt;/p&gt;

&lt;h3 id=&quot;基本信息收集&quot;&gt;&lt;strong&gt;基本信息收集&lt;/strong&gt;&lt;/h3&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;公开信息&lt;/strong&gt;: 网络上关于海域云的评价较少,这本身就是个风险信号&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;主要客户群&lt;/strong&gt;: 从有限的信息看,主要服务中小企业和个人开发者&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;价格定位&lt;/strong&gt;: 明显低于市场主流价格15-40%&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;优势详解&quot;&gt;&lt;strong&gt;优势详解&lt;/strong&gt;&lt;/h3&gt;

&lt;h4 id=&quot;1-价格优势显著&quot;&gt;1. &lt;strong&gt;价格优势显著&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;比润迅便宜25-35%,比万国数据便宜40-50%&lt;/li&gt;
  &lt;li&gt;对于8卡4090这种高功耗设备,年省5000-8000元很有吸引力&lt;/li&gt;
  &lt;li&gt;合同灵活,可月付或季付,试错成本低&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;2-高功耗设备友好&quot;&gt;2. &lt;strong&gt;高功耗设备友好&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;据了解部分机柜支持6-8kW功率,这对8卡4090很重要&lt;/li&gt;
  &lt;li&gt;老牌机房可能对高功耗设备有各种限制,海域云相对宽松&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;3-决策效率高&quot;&gt;3. &lt;strong&gt;决策效率高&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;小公司运作,销售-技术-运维链条短&lt;/li&gt;
  &lt;li&gt;有问题可以直接找到负责人,不像大公司层层流程&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;4-合同灵活度&quot;&gt;4. &lt;strong&gt;合同灵活度&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;不强制年付,可短期试用&lt;/li&gt;
  &lt;li&gt;退出条款相对宽松(大公司通常要求提前3个月通知)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;劣势详解&quot;&gt;&lt;strong&gt;劣势详解&lt;/strong&gt;&lt;/h3&gt;

&lt;h4 id=&quot;1-品牌信任度低-️-最大风险&quot;&gt;1. &lt;strong&gt;品牌信任度低&lt;/strong&gt; ⚠️ &lt;strong&gt;最大风险&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;成立时间可能较短(具体需实地考察时确认)&lt;/li&gt;
  &lt;li&gt;网络公开评价少,难以验证真实服务质量&lt;/li&gt;
  &lt;li&gt;无法确认财务状况,存在跑路风险(虽然概率低,但不是零)&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;2-合规资质可能不全&quot;&gt;2. &lt;strong&gt;合规资质可能不全&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;IDC许可证: 需要确认(这是底线,没有就是黑机房)&lt;/li&gt;
  &lt;li&gt;等保认证: 可能没有或只有二级&lt;/li&gt;
  &lt;li&gt;ISO认证: 大概率没有&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;影响&lt;/strong&gt;: 如果你需要向客户/合作方提供机房资质证明,可能不够用&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;3-技术实力存疑&quot;&gt;3. &lt;strong&gt;技术实力存疑&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;遇到复杂网络问题(BGP路由、DDoS攻击),解决能力可能不如老牌IDC&lt;/li&gt;
  &lt;li&gt;运维团队规模小,可能没有7×24小时多班次值守&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;风险&lt;/strong&gt;: 半夜出问题,可能找不到人或响应慢&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;4-抗风险能力弱&quot;&gt;4. &lt;strong&gt;抗风险能力弱&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;如果机房自身遇到问题(如被断电、被清退),客户可能措手不及&lt;/li&gt;
  &lt;li&gt;没有多地容灾能力,出事只能等修或者搬走&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;5-sla赔偿可能不到位&quot;&gt;5. &lt;strong&gt;SLA赔偿可能不到位&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;小公司财务能力有限,即使合同约定赔偿,实际能否兑现存疑&lt;/li&gt;
  &lt;li&gt;大公司如润迅,赔偿会真的打到你账户;小公司可能扯皮&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;实地考察重点针对海域云&quot;&gt;&lt;strong&gt;实地考察重点(针对海域云)&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;如果决定考虑海域云,实地考察时必须重点看:&lt;/p&gt;

&lt;h4 id=&quot;必看项一票否决&quot;&gt;&lt;strong&gt;必看项(一票否决)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;✅ IDC经营许可证原件(拍照留存,回来工信部官网验证)&lt;/li&gt;
  &lt;li&gt;✅ 机房产权证明(是自有还是租赁?租约到期时间?)&lt;/li&gt;
  &lt;li&gt;✅ UPS和柴油发电机实物(拍照,看设备品牌和新旧程度)&lt;/li&gt;
  &lt;li&gt;✅ 消防系统类型(必须是气体灭火,如果是水喷淋直接走人)&lt;/li&gt;
  &lt;li&gt;✅ 现场至少看到5个以上已托管的服务器机柜(证明有真实客户)&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;加分项&quot;&gt;&lt;strong&gt;加分项&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 是否有其他8卡GPU服务器客户?能否看到实际运行温度?&lt;/li&gt;
  &lt;li&gt;✅ 运维值班室是否有人?设备监控大屏是否实时显示?&lt;/li&gt;
  &lt;li&gt;✅ 精密空调品牌(艾默生、施耐德为佳,杂牌要警惕)&lt;/li&gt;
  &lt;li&gt;✅ 机房整洁度、走线规范性(反映管理水平)&lt;/li&gt;
  &lt;li&gt;✅ 能否提供现有客户联系方式(真实客户会告诉你真实体验)&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;观察细节&quot;&gt;&lt;strong&gt;观察细节&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;🔍 销售是否避重就轻回避资质问题?&lt;/li&gt;
  &lt;li&gt;🔍 是否允许你随便拍照?(正规机房通常允许,黑机房会阻止)&lt;/li&gt;
  &lt;li&gt;🔍 门禁系统是否真的在用?(有的机房有门禁但常年不启用)&lt;/li&gt;
  &lt;li&gt;🔍 机房温度实测(带个温度计,看是否真的22-24°C)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;决策矩阵海域云-vs-润迅&quot;&gt;&lt;strong&gt;决策矩阵:海域云 vs 润迅&lt;/strong&gt;&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;海域云&lt;/th&gt;
      &lt;th&gt;润迅数据中心&lt;/th&gt;
      &lt;th&gt;权重&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;价格&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐⭐⭐ 便宜25%&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐ 市场中位价&lt;/td&gt;
      &lt;td&gt;30%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;稳定性&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐ 未知,需实测&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐⭐⭐ 20年口碑&lt;/td&gt;
      &lt;td&gt;35%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术实力&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;⭐⭐ 小团队&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐⭐ 经验丰富&lt;/td&gt;
      &lt;td&gt;15%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;合规资质&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;⭐⭐ 可能不全&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐⭐⭐ 齐全&lt;/td&gt;
      &lt;td&gt;10%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;合同灵活性&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐⭐⭐ 月付可&lt;/td&gt;
      &lt;td&gt;⭐⭐⭐ 通常年付&lt;/td&gt;
      &lt;td&gt;10%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;综合评分&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;&lt;strong&gt;3.45/5&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;&lt;strong&gt;4.15/5&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;h3 id=&quot;我的建议分阶段策略&quot;&gt;&lt;strong&gt;我的建议:分阶段策略&lt;/strong&gt;&lt;/h3&gt;

&lt;h4 id=&quot;阶段1-海域云试用1-3个月&quot;&gt;&lt;strong&gt;阶段1: 海域云试用(1-3个月)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;策略&lt;/strong&gt;: 签3个月短期合同,作为试验&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;同步准备&lt;/strong&gt;: 与润迅谈好备用方案,保持联系&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;监控&lt;/strong&gt;: 每天检查服务器运行状态,记录任何异常&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;成本&lt;/strong&gt;: 比润迅月省600-800元,3个月省1800-2400元&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;阶段2-评估决策第3个月末&quot;&gt;&lt;strong&gt;阶段2: 评估决策(第3个月末)&lt;/strong&gt;&lt;/h4&gt;
&lt;p&gt;&lt;strong&gt;如果海域云表现良好(无重大故障,响应及时)&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 续约6-12个月,享受年付折扣&lt;/li&gt;
  &lt;li&gt;✅ 继续保持警惕,每月检查&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;如果出现以下情况,立即切换到润迅&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;❌ 断电/断网累计超过2次&lt;/li&gt;
  &lt;li&gt;❌ 故障响应时间&amp;gt;2小时&lt;/li&gt;
  &lt;li&gt;❌ 机房出现任何安全隐患(如消防系统故障)&lt;/li&gt;
  &lt;li&gt;❌ 合同条款不兑现(如承诺的带宽缩水)&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;阶段3-长期运行&quot;&gt;&lt;strong&gt;阶段3: 长期运行&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;润迅作为主力,稳定运行&lt;/li&gt;
  &lt;li&gt;或海域云验证通过,继续使用并节省成本&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;最终判断海域云适合你吗&quot;&gt;&lt;strong&gt;最终判断:海域云适合你吗?&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;✅ 适合,如果你&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 是内部训练,不是在线服务&lt;/li&gt;
  &lt;li&gt;✅ 能接受偶尔宕机(有checkpoint备份)&lt;/li&gt;
  &lt;li&gt;✅ 预算敏感,年省5000元很有价值&lt;/li&gt;
  &lt;li&gt;✅ 愿意花精力监控和管理&lt;/li&gt;
  &lt;li&gt;✅ 有备用方案和迁移能力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;❌ 不适合,如果你&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;❌ 是在线服务,宕机直接损失用户&lt;/li&gt;
  &lt;li&gt;❌ 需要向客户/投资人提供机房资质&lt;/li&gt;
  &lt;li&gt;❌ 公司属于金融、医疗等强监管行业&lt;/li&gt;
  &lt;li&gt;❌ 希望完全省心,不想操心机房问题&lt;/li&gt;
  &lt;li&gt;❌ 不具备快速迁移能力&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;实操建议&quot;&gt;&lt;strong&gt;实操建议&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;第1步&lt;/strong&gt;: 联系海域云和润迅,分别索要报价和SLA
&lt;strong&gt;第2步&lt;/strong&gt;: 实地考察海域云(带上上面的检查清单)
&lt;strong&gt;第3步&lt;/strong&gt;: 如果海域云考察通过,同时与润迅谈好备用价格
&lt;strong&gt;第4步&lt;/strong&gt;: 海域云签3个月,谨慎试用
&lt;strong&gt;第5步&lt;/strong&gt;: 3个月后根据实际体验决策&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;💡 关键&lt;/strong&gt;: 不要一次性签长期合同,灵活性&amp;gt;价格优惠&lt;/p&gt;

&lt;h2 id=&quot;九总结与建议&quot;&gt;九、总结与建议&lt;/h2&gt;

&lt;p&gt;作为一个技术外行,通过这次调研,我的核心建议是:&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;strong&gt;不要只看价格&lt;/strong&gt;: T3级机房相比T2级,年宕机时间从22小时降到1.6小时,这个差异对业务连续性至关重要&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;strong&gt;必须实地考察&lt;/strong&gt;: 照片和宣传资料不靠谱,亲眼看到机房的整洁度、设备状态才能放心&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;strong&gt;重视SLA条款&lt;/strong&gt;: 可用性承诺必须写进合同,并明确赔偿标准&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;strong&gt;8卡显卡服务器电费是大头&lt;/strong&gt;: 月电费可达2500-3000元,占总成本50-70%,电价谈判至关重要&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;strong&gt;选择有口碑的老牌机房&lt;/strong&gt;: 虽然可能贵10-20%,但稳定性和服务质量更有保障&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;&lt;strong&gt;建议起步选T3级&lt;/strong&gt;: 性价比最高,除非你的业务真的能接受每年20+小时的宕机&lt;/p&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;我的最终选择倾向针对8卡4090内部训练&quot;&gt;&lt;strong&gt;我的最终选择倾向(针对8卡4090内部训练)&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;综合考虑安全性、性价比和口碑,针对&lt;strong&gt;内部AI训练&lt;/strong&gt;场景,我的选择策略:&lt;/p&gt;

&lt;h4 id=&quot;-稳妥方案推荐&quot;&gt;&lt;strong&gt;🥇 稳妥方案(推荐)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;首选&lt;/strong&gt;: 润迅/世纪互联 T3级机房&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;月成本&lt;/strong&gt;: 3800-4200元(含10M带宽)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;优势&lt;/strong&gt;: 稳定性有保障,出问题能快速解决,适合长期使用&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;适用&lt;/strong&gt;: 公司有一定预算,希望省心&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;-性价比方案我倾向尝试&quot;&gt;&lt;strong&gt;🥈 性价比方案(我倾向尝试)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;首选&lt;/strong&gt;: 海域云/景安网络&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;月成本&lt;/strong&gt;: 3200-3600元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;策略&lt;/strong&gt;: 先签3-6个月短期合同,实测稳定性
    &lt;ul&gt;
      &lt;li&gt;如果3个月内没出大问题,续约1年&lt;/li&gt;
      &lt;li&gt;如果频繁断电断网,立即切换到润迅&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;优势&lt;/strong&gt;: 省钱20-25%,一年省4000-6000元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;风险控制&lt;/strong&gt;: 做好训练checkpoint备份,万一宕机损失可控&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;-极致性价比不推荐除非预算极紧&quot;&gt;&lt;strong&gt;🥉 极致性价比(不推荐,除非预算极紧)&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;选择&lt;/strong&gt;: 快网/小机房&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;月成本&lt;/strong&gt;: 2800-3200元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;风险&lt;/strong&gt;: 可能频繁出问题,耽误训练进度,性价比实际不高&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;-我的决策思路&quot;&gt;&lt;strong&gt;💡 我的决策思路&lt;/strong&gt;&lt;/h4&gt;
&lt;p&gt;由于是&lt;strong&gt;内部训练&lt;/strong&gt;而非在线服务:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;偶尔宕机1-2小时可接受(不像在线服务直接损失用户)&lt;/li&gt;
  &lt;li&gt;训练任务可以从checkpoint恢复,不怕断电&lt;/li&gt;
  &lt;li&gt;省下的钱(年省5000+)可以加购GPU或扩展其他资源&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;所以我倾向于&lt;strong&gt;先尝试海域云&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 第1个月: 实地考察 + 小心翼翼观察(频繁检查监控,随时准备跑路)&lt;/li&gt;
  &lt;li&gt;✅ 第2-3个月: 如果稳定,开始放心使用&lt;/li&gt;
  &lt;li&gt;✅ 第4-6个月: 如果依然稳定,年付续约&lt;/li&gt;
  &lt;li&gt;❌ 任何时候出现严重问题: 立即迁移到润迅(提前谈好备用方案)&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;-不考虑的方案&quot;&gt;&lt;strong&gt;🚫 不考虑的方案&lt;/strong&gt;&lt;/h4&gt;
&lt;ul&gt;
  &lt;li&gt;❌ 腾讯云/万国数据: 对内部训练来说性价比太低,贵30-50%但收益有限&lt;/li&gt;
  &lt;li&gt;❌ 二房东: 风险太大,省的钱不值得&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;希望这份指南能帮助到同样需要托管显卡服务器的朋友。如果你有实际的托管经验或其他机房推荐,欢迎在评论区分享!&lt;/p&gt;

&lt;hr /&gt;

&lt;p&gt;&lt;strong&gt;参考资源&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;Uptime Institute Tier 标准官方文档&lt;/li&gt;
  &lt;li&gt;工信部IDC许可证查询: &lt;a href=&quot;https://beian.miit.gov.cn/&quot;&gt;域名信息备案管理系统&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;等保认证查询: 各地区网信办官网&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;免责声明&lt;/strong&gt;: 本文价格信息为市场调研参考,实际报价请联系机房销售。机房选择建议基于公开信息整理,不构成商业推荐,请根据自身需求独立判断。&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>中国AI三足鼎立：腾讯混元、阶跃星辰、MiniMax技术路线深度拆解与未来研判</title>
   <link href="https://loredunk.github.io//blog/2026/01/15/china-ai-triforce-tencent-stepfun-minimax/"/>
   <updated>2026-01-15T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2026/01/15/china-ai-triforce-tencent-stepfun-minimax</id>
   <content type="html">&lt;p&gt;2025年的中国AI大模型赛道,正在形成一个有趣的”三足鼎立”格局:腾讯混元代表&lt;strong&gt;互联网巨头的生态整合路线&lt;/strong&gt;,阶跃星辰押注&lt;strong&gt;智能终端Agent的垂直突破&lt;/strong&gt;,MiniMax则以&lt;strong&gt;极致效率和全球化&lt;/strong&gt;走出了第三条路。本文将从技术能力、商业模式、工程实力到未来潜力,全方位拆解这三家公司的竞争态势。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;一公司基因与团队实力对比&quot;&gt;一、公司基因与团队实力对比&lt;/h2&gt;

&lt;h3 id=&quot;腾讯元宝混元大厂基因&quot;&gt;腾讯元宝/混元:大厂基因&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;成立背景&lt;/strong&gt;: 腾讯混元是腾讯自研的基础大模型,元宝是其C端应用。2025年4月进行研发体系重构,成立大语言模型部和多模态模型部。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;背靠腾讯强大的基础设施和算力资源&lt;/li&gt;
  &lt;li&gt;深度整合微信、QQ等600+业务线&lt;/li&gt;
  &lt;li&gt;腾讯生态海量用户数据支撑&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;团队特点&lt;/strong&gt;: 大公司体系,资源充足,注重稳健和业务落地&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰技术精英路线&quot;&gt;阶跃星辰:技术精英路线&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;成立时间&lt;/strong&gt;: 2023年4月,短短2年跻身”AI六小龙”&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心团队&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;创始人姜大昕&lt;/strong&gt;: 前微软全球副总裁、微软亚洲互联网工程院首席科学家&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;焦斌星&lt;/strong&gt;: 前微软必应引擎核心搜索团队负责人&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;朱亦博&lt;/strong&gt;: Google、字节跳动经验&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;团队特点&lt;/strong&gt;: 微软系+国际大厂背景,技术前瞻性强,2年发布16款多模态模型&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;融资&lt;/strong&gt;: 2024年底完成数亿美元B轮,获国有资本和腾讯支持&lt;/p&gt;

&lt;h3 id=&quot;minimax草根逆袭典范&quot;&gt;MiniMax:草根逆袭典范&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;成立时间&lt;/strong&gt;: 2021年12月,ChatGPT发布前就开始大模型研发&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;创始人闫俊杰&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;1989年生于河南县城&lt;/li&gt;
  &lt;li&gt;东南大学数学本科→中科院自动化所博士→清华博士后&lt;/li&gt;
  &lt;li&gt;前商汤科技副总裁、研究院副院长、智慧城市事业群CTO&lt;/li&gt;
  &lt;li&gt;在商汤从实习生做到副总裁,管理700-800人团队&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;团队特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;全员385人&lt;/strong&gt;,平均年龄&lt;strong&gt;29岁&lt;/strong&gt;(95后)&lt;/li&gt;
  &lt;li&gt;研发人员占比&lt;strong&gt;73.8%&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;创始人自称”草根背景”,核心团队”有些甚至不是这个专业出身”&lt;/li&gt;
  &lt;li&gt;早期联合创始人周彧聪和贠烨祎在AI1.0时代就有实战经验&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;IPO进展&lt;/strong&gt;: 2025年12月通过港交所聆讯,预计2026年1月上市,成为最快IPO的AI公司&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;企业愿景&lt;/strong&gt;: “Intelligence with Everyone”(智能与每个人同在)&lt;/p&gt;

&lt;h3 id=&quot;团队对比总结&quot;&gt;团队对比总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;基因类型&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;互联网巨头&lt;/td&gt;
      &lt;td&gt;技术精英创业&lt;/td&gt;
      &lt;td&gt;草根逆袭&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;团队规模&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;大型(未披露)&lt;/td&gt;
      &lt;td&gt;中型&lt;/td&gt;
      &lt;td&gt;385人(最精简)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;团队背景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;腾讯体系&lt;/td&gt;
      &lt;td&gt;微软系&lt;/td&gt;
      &lt;td&gt;商汤系&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;成立时间&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;混元2023&lt;/td&gt;
      &lt;td&gt;2023年4月&lt;/td&gt;
      &lt;td&gt;2021年12月(最早)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;平均年龄&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;29岁(最年轻)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;研发占比&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;高&lt;/td&gt;
      &lt;td&gt;73.8%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;资源、生态&lt;/td&gt;
      &lt;td&gt;技术前瞻&lt;/td&gt;
      &lt;td&gt;效率、全球化&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: 大厂打法,不求激进创新,但求稳健落地&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: 技术驱动,前瞻布局,依赖外部合作变现&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;: 最早布局,团队精简高效,全球化商业化能力最强&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;二数据资源规模与质量的权衡&quot;&gt;二、数据资源:规模与质量的权衡&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元生态数据优势&quot;&gt;腾讯混元:生态数据优势&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;训练数据规模&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;预训练数据从1万亿升级到&lt;strong&gt;7万亿tokens&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;使用超过100万条SFT数据&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;生态数据资源&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;深度整合微信公众号等生态资源(注:未明确使用微信/QQ私人对话数据)&lt;/li&gt;
  &lt;li&gt;可利用腾讯大数据平台&lt;/li&gt;
  &lt;li&gt;强调合成数据:对质量不一致的公开网络数据进行转换和增强&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;数据策略&lt;/strong&gt;: 规模+质量双驱动,生态数据是独特优势&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰合成数据引擎&quot;&gt;阶跃星辰:合成数据引擎&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;数据规模&lt;/strong&gt;(以Step-Audio为例):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;音频: 1.1万亿tokens(约73万小时)&lt;/li&gt;
  &lt;li&gt;TTS合成语音: 1.13万亿tokens&lt;/li&gt;
  &lt;li&gt;ASR数据: 1.05万亿tokens&lt;/li&gt;
  &lt;li&gt;音频-文本交替: 3.5万亿tokens&lt;/li&gt;
  &lt;li&gt;文本: 8000亿tokens&lt;/li&gt;
  &lt;li&gt;图像: 8000亿图像-文本配对tokens&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;核心能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;通过&lt;strong&gt;生成式数据引擎&lt;/strong&gt;消除对传统手动数据收集的依赖&lt;/li&gt;
  &lt;li&gt;使用Step-2 LLM生成语言学多样且语义丰富的文本&lt;/li&gt;
  &lt;li&gt;Step 3多模语料引入相似度过滤、重采样与任务比例控制&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;: 无大规模内部生态数据,更依赖公开数据和合成能力&lt;/p&gt;

&lt;h3 id=&quot;minimax精细化数据工程&quot;&gt;MiniMax:精细化数据工程&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;数据质量体系&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;预训练语料涵盖学术文献、书籍、网络内容、编程代码等多源数据&lt;/li&gt;
  &lt;li&gt;通过严格的数据清洗、基于奖励的质量增强、更好的数据混合平衡&lt;/li&gt;
  &lt;li&gt;开发了&lt;strong&gt;数据实验框架&lt;/strong&gt;,能快速高效评估数据有效性,同时最大限度降低计算成本&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;数据分布优化&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;使用三大质量指标调整数据分布&lt;/li&gt;
  &lt;li&gt;实施平衡采样策略:先从基础语料库均匀采样,再调整采样权重优先高质量内容&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;分词优化&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;采用字节级BPE结合预分词器&lt;/li&gt;
  &lt;li&gt;策略性上采样多语言内容以提高压缩效率&lt;/li&gt;
  &lt;li&gt;词汇表大小设定为&lt;strong&gt;20万tokens&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;已知限制&lt;/strong&gt;: 预训练阶段编程数据集数量有限(未来版本将改进)&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;训练规模&lt;/strong&gt;: MiniMax-VL-01额外使用5120亿视觉-语言tokens,采用四阶段训练流程&lt;/p&gt;

&lt;h3 id=&quot;数据资源对比&quot;&gt;数据资源对比&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;数据规模&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;7万亿tokens&lt;/td&gt;
      &lt;td&gt;多模态总计10万亿+&lt;/td&gt;
      &lt;td&gt;未明确披露总量&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;独特优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;腾讯生态数据&lt;/td&gt;
      &lt;td&gt;合成数据引擎&lt;/td&gt;
      &lt;td&gt;数据实验框架&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;数据策略&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;规模驱动&lt;/td&gt;
      &lt;td&gt;合成+多模态&lt;/td&gt;
      &lt;td&gt;质量+效率驱动&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;质量控制&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;合成数据增强&lt;/td&gt;
      &lt;td&gt;相似度过滤、重采样&lt;/td&gt;
      &lt;td&gt;奖励模型质量增强&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;多语言&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未强调&lt;/td&gt;
      &lt;td&gt;支持&lt;/td&gt;
      &lt;td&gt;策略性上采样&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;在数据规模和生态数据上有优势&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;在多模态数据丰富度上领先&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;在数据工程和效率优化上最精细&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;三开源策略从封闭到开放的不同路径&quot;&gt;三、开源策略:从封闭到开放的不同路径&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元全系开源战略&quot;&gt;腾讯混元:全系开源战略&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;开源理念&lt;/strong&gt;: “坚定拥抱开源”,持续推进多尺寸、多场景全系模型开源&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;主要开源模型&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型系列&lt;/th&gt;
      &lt;th&gt;参数规模&lt;/th&gt;
      &lt;th&gt;特性&lt;/th&gt;
      &lt;th&gt;发布时间&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;混元-Large&lt;/td&gt;
      &lt;td&gt;3890亿总参数,520亿激活&lt;/td&gt;
      &lt;td&gt;当时业界最大开源MoE&lt;/td&gt;
      &lt;td&gt;2024年&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;混元2.0&lt;/td&gt;
      &lt;td&gt;406B总参数,32B激活&lt;/td&gt;
      &lt;td&gt;256K超长上下文&lt;/td&gt;
      &lt;td&gt;2024年12月&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Hunyuan-A13B&lt;/td&gt;
      &lt;td&gt;80B总参数,13B激活&lt;/td&gt;
      &lt;td&gt;首款13B级MoE开源混合推理&lt;/td&gt;
      &lt;td&gt;2025年6月&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;小尺寸模型&lt;/td&gt;
      &lt;td&gt;0.5B/1.8B/4B/7B&lt;/td&gt;
      &lt;td&gt;端侧部署&lt;/td&gt;
      &lt;td&gt;2025年8月&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;混元3D世界模型1.0&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;首个可沉浸漫游、可交互、可仿真&lt;/td&gt;
      &lt;td&gt;2025年7月&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;社区反响&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;混元-A13B开源仅3天拿下Hugging Face趋势榜&lt;strong&gt;第2名&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;混元3D系列社区下载量超&lt;strong&gt;230万&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;图像、视频衍生模型数量分别达到1400和1600个&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;生态支持&lt;/strong&gt;: Github、HuggingFace、魔搭社区,Arm、高通、Intel、联发科技等芯片厂商支持&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰激进开源商业合作&quot;&gt;阶跃星辰:激进开源+商业合作&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;开源策略&lt;/strong&gt;: 以开源为核心战略,快速建立技术影响力&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;重磅开源模型&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型系列&lt;/th&gt;
      &lt;th&gt;参数规模&lt;/th&gt;
      &lt;th&gt;特性&lt;/th&gt;
      &lt;th&gt;发布时间&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;Step 3&lt;/td&gt;
      &lt;td&gt;321B总参数,38B激活&lt;/td&gt;
      &lt;td&gt;最新一代基础大模型&lt;/td&gt;
      &lt;td&gt;2025年7月31日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step-Video-T2V&lt;/td&gt;
      &lt;td&gt;300亿参数&lt;/td&gt;
      &lt;td&gt;全球参数量最大开源视频生成&lt;/td&gt;
      &lt;td&gt;2025年2月18日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step-Audio&lt;/td&gt;
      &lt;td&gt;千亿参数&lt;/td&gt;
      &lt;td&gt;首款产品级开源实时语音对话&lt;/td&gt;
      &lt;td&gt;2025年2月18日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step R-mini&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;首款推理模型&lt;/td&gt;
      &lt;td&gt;2025年1月&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;社区表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;开源第一日,GitHub双仓库接近1000星&lt;/li&gt;
  &lt;li&gt;与吉利汽车集团联合开源&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;合作生态&lt;/strong&gt;: 火山引擎、阿里云、华为昇腾、HuggingFace、ModelScope等&lt;/p&gt;

&lt;h3 id=&quot;minimax选择性开源闭源商业化&quot;&gt;MiniMax:选择性开源+闭源商业化&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;开源策略&lt;/strong&gt;: &lt;strong&gt;新近转向开源&lt;/strong&gt;,但更注重闭源模型的商业化&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;开源模型&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型系列&lt;/th&gt;
      &lt;th&gt;参数规模&lt;/th&gt;
      &lt;th&gt;特性&lt;/th&gt;
      &lt;th&gt;发布时间&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;MiniMax-01系列&lt;/td&gt;
      &lt;td&gt;456B总参数,45.9B激活&lt;/td&gt;
      &lt;td&gt;Lightning Attention,4M上下文&lt;/td&gt;
      &lt;td&gt;2025年1月15日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;MiniMax-Text-01&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;基础语言大模型&lt;/td&gt;
      &lt;td&gt;2025年1月15日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;MiniMax-VL-01&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;视觉多模态大模型&lt;/td&gt;
      &lt;td&gt;2025年1月15日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;MiniMax-M1&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;全球首个开源大规模混合架构推理模型&lt;/td&gt;
      &lt;td&gt;2025年&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;MiniMax-M2&lt;/td&gt;
      &lt;td&gt;230B总参数,10B激活&lt;/td&gt;
      &lt;td&gt;紧凑、快速、经济,专为编码和Agent&lt;/td&gt;
      &lt;td&gt;2025年&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;技术创新&lt;/strong&gt;: &lt;strong&gt;Lightning Attention&lt;/strong&gt;(线性注意力机制),业界首次大规模实现,挑战Transformer架构&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;闭源商业模型&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;abab 6.5系列(万亿参数MoE)&lt;/li&gt;
  &lt;li&gt;abab 6.5s(超快推理速度)&lt;/li&gt;
  &lt;li&gt;主要通过API和C端应用商业化&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;开源时机&lt;/strong&gt;: 2025年1月才开始开源,晚于腾讯和阶跃星辰,但一出手就是颠覆性架构&lt;/p&gt;

&lt;h3 id=&quot;开源策略对比&quot;&gt;开源策略对比&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;开源力度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;全系开源&lt;/td&gt;
      &lt;td&gt;重点模型开源&lt;/td&gt;
      &lt;td&gt;选择性开源&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;最大模型&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;3890B&lt;/td&gt;
      &lt;td&gt;321B&lt;/td&gt;
      &lt;td&gt;456B&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;开源时间&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;2024年起&lt;/td&gt;
      &lt;td&gt;2025年2月起&lt;/td&gt;
      &lt;td&gt;2025年1月起(最晚)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术创新&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;端侧小模型+3D&lt;/td&gt;
      &lt;td&gt;视频+音频&lt;/td&gt;
      &lt;td&gt;Lightning Attention&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;社区活跃&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;HF第2名,230万下载&lt;/td&gt;
      &lt;td&gt;首日1000星&lt;/td&gt;
      &lt;td&gt;刚开始积累&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;商业模式&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;开源+内部生态&lt;/td&gt;
      &lt;td&gt;开源+外部合作&lt;/td&gt;
      &lt;td&gt;闭源商业化为主&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: 开源最全面,支撑生态和业务&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: 开源最激进,快速建立影响力&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;: 开源最保守但最具颠覆性,主要靠闭源商业化赚钱&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;四agent与长上下文未来场景的竞争焦点&quot;&gt;四、Agent与长上下文:未来场景的竞争焦点&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元企业级agent平台&quot;&gt;腾讯混元:企业级Agent平台&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;长上下文能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;预训练模型: &lt;strong&gt;256K上下文&lt;/strong&gt;(约50万字)&lt;/li&gt;
  &lt;li&gt;指令模型: &lt;strong&gt;128K长序列&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;应用场景: 处理整本书籍、完整代码库,法律文档分析、代码审计效率提升&lt;strong&gt;300%&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Agent平台&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯元器&lt;/strong&gt;: 智能体开发平台&lt;/li&gt;
  &lt;li&gt;高级RAG能力、工作流能力、多智能体协作机制&lt;/li&gt;
  &lt;li&gt;支持企业级部署&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;规模化应用&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;混元-A13B擅长Agent工具调用和长文理解&lt;/li&gt;
  &lt;li&gt;超过&lt;strong&gt;400+业务&lt;/strong&gt;精调或直接调用&lt;/li&gt;
  &lt;li&gt;日均请求超&lt;strong&gt;1.3亿次&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;技术路线&lt;/strong&gt;: RAG技术+长上下文+工具调用,强调在专业领域(法律、医疗、金融)减少AI幻觉&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰智能终端agent&quot;&gt;阶跃星辰:智能终端Agent&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;长上下文能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;Step-1V: &lt;strong&gt;128K上下文&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;Step 3: 采用5B Vision Encoder,视觉token降至1/16,减轻上下文压力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Agent战略定位&lt;/strong&gt;:
姜大昕明确:&lt;strong&gt;2025年是Agent元年&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Agent能力的两大基石&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;多模态能力&lt;/strong&gt;: 全面感知和理解世界&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;推理能力&lt;/strong&gt;(慢思考): 长链推理、主动规划、尝试、反思、纠错&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;Agent五层级路径&lt;/strong&gt;: 从Level 1(完成简单任务)到Level 5(情商阶段)&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;战略聚焦&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;智能终端Agent&lt;/strong&gt;是核心突破点&lt;/li&gt;
  &lt;li&gt;重点布局&lt;strong&gt;四大终端&lt;/strong&gt;: 汽车、手机、具身智能(机器人)、IoT&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;汽车&lt;/strong&gt;是”最关键的Agent落地场景”&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;合作案例&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;吉利: 下一代智能座舱Agent OS&lt;/li&gt;
  &lt;li&gt;OPPO: 手机场景&lt;/li&gt;
  &lt;li&gt;智元机器人: 具身智能&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;minimax超长上下文分层agent&quot;&gt;MiniMax:超长上下文+分层Agent&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;长上下文能力&lt;/strong&gt;(行业领先):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;MiniMax-01系列: &lt;strong&gt;400万token上下文&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;GPT-4o的32倍&lt;/strong&gt;、&lt;strong&gt;Claude-3.5-Sonnet的20倍&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;MiniMax Agent: 原生支持&lt;strong&gt;100万token输入&lt;/strong&gt;(DeepSeek R1的8倍)&lt;/li&gt;
  &lt;li&gt;支持&lt;strong&gt;8万token输出&lt;/strong&gt;(超过Gemini 2.5 Pro的6.4万)&lt;/li&gt;
  &lt;li&gt;400万大海捞针测试(NIAH)全绿,可精准定位任何位置信息&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;技术突破&lt;/strong&gt;:
&lt;strong&gt;Lightning Attention&lt;/strong&gt;(线性注意力机制)解决传统Transformer的二次增长计算复杂度问题,从而实现400万token超长上下文&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Agent架构&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;分层协作架构&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;总调度Agent: 理解整体意图,任务分解和规划&lt;/li&gt;
      &lt;li&gt;执行Agent: 专注具体任务(编码、设计、研究等)&lt;/li&gt;
      &lt;li&gt;支持最多&lt;strong&gt;7个智能体同时协作&lt;/strong&gt;&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;记忆与反思机制&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;在长达数小时甚至数天的任务中保持信息连贯性&lt;/li&gt;
  &lt;li&gt;主动审视进展,识别问题,动态调整策略&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;战略定位&lt;/strong&gt;: 2025年是AI Agent高速发展的一年,长上下文是Agent系统的核心需求&lt;/p&gt;

&lt;h3 id=&quot;agent与长上下文对比&quot;&gt;Agent与长上下文对比&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;长上下文&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;256K(预训练),128K(指令)&lt;/td&gt;
      &lt;td&gt;128K&lt;/td&gt;
      &lt;td&gt;&lt;strong&gt;400万token&lt;/strong&gt;(绝对领先)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术创新&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;RAG技术&lt;/td&gt;
      &lt;td&gt;视觉token压缩&lt;/td&gt;
      &lt;td&gt;Lightning Attention&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;Agent策略&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;企业级平台&lt;/td&gt;
      &lt;td&gt;智能终端Agent&lt;/td&gt;
      &lt;td&gt;分层协作Agent&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;聚焦场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;400+内部业务&lt;/td&gt;
      &lt;td&gt;汽车/手机/机器人/IoT&lt;/td&gt;
      &lt;td&gt;编程/多模态/企业任务&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;日均调用&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;1.3亿+&lt;/td&gt;
      &lt;td&gt;未公开&lt;/td&gt;
      &lt;td&gt;未公开&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;输入长度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;256K&lt;/td&gt;
      &lt;td&gt;128K&lt;/td&gt;
      &lt;td&gt;&lt;strong&gt;100万token&lt;/strong&gt;&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;输出长度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未明确&lt;/td&gt;
      &lt;td&gt;未明确&lt;/td&gt;
      &lt;td&gt;&lt;strong&gt;8万token&lt;/strong&gt;(最长)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;大海捞针&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;400万全绿&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心差异&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: 横向整合,企业级能力,依托生态&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: 垂直突破,聚焦智能终端,合作伙伴生态&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;: &lt;strong&gt;技术维度绝对领先&lt;/strong&gt;,超长上下文+分层Agent,支撑复杂任务&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;: 在长上下文和Agent能力上,&lt;strong&gt;MiniMax技术领先最明显&lt;/strong&gt;,腾讯规模化应用最成熟,阶跃星辰场景聚焦最清晰。&lt;/p&gt;

&lt;h2 id=&quot;五端侧部署移动化的分水岭&quot;&gt;五、端侧部署:移动化的分水岭&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元全栈端侧方案最完善&quot;&gt;腾讯混元:全栈端侧方案(最完善)&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;小尺寸模型矩阵&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型规模&lt;/th&gt;
      &lt;th&gt;部署场景&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;0.5B&lt;/td&gt;
      &lt;td&gt;消费级显卡&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;1.8B&lt;/td&gt;
      &lt;td&gt;笔记本电脑&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;4B&lt;/td&gt;
      &lt;td&gt;手机、智能座舱&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;7B&lt;/td&gt;
      &lt;td&gt;智能家居等低功耗场景&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;技术特性&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;融合推理模型&lt;/strong&gt;: 快思考(简洁高效)+ 慢思考(全面推理)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;低成本微调&lt;/strong&gt;: 支持垂直领域定制&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;落地案例&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;应用&lt;/th&gt;
      &lt;th&gt;场景&lt;/th&gt;
      &lt;th&gt;效果&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;腾讯手机管家&lt;/td&gt;
      &lt;td&gt;垃圾短信识别&lt;/td&gt;
      &lt;td&gt;毫秒级拦截,隐私零上传&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;腾讯智能座舱助手&lt;/td&gt;
      &lt;td&gt;车载环境&lt;/td&gt;
      &lt;td&gt;低功耗、高效推理&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;搜狗输入法&lt;/td&gt;
      &lt;td&gt;语音识别&lt;/td&gt;
      &lt;td&gt;嘈杂环境准确率提升&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;腾讯地图&lt;/td&gt;
      &lt;td&gt;多模型架构&lt;/td&gt;
      &lt;td&gt;意图分类和推理能力提升&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;微信输入法&lt;/td&gt;
      &lt;td&gt;“问AI”功能&lt;/td&gt;
      &lt;td&gt;输入框与AI无缝衔接&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;芯片支持&lt;/strong&gt;: Arm、高通、Intel、联发科技全面支持&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰合作伙伴生态&quot;&gt;阶跃星辰:合作伙伴生态&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;部署策略&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;主要通过合作伙伴实现端侧部署&lt;/li&gt;
  &lt;li&gt;与吉利通过DeepSeek-R1模型蒸馏训练”汽车主动交互端侧大模型”&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;部署平台&lt;/strong&gt;: 火山引擎、魔乐社区、魔搭社区、HuggingFace、阿里云、TCL&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;: 未独立推出小型端侧模型系列(如0.5B-7B),依赖合作伙伴适配&lt;/p&gt;

&lt;h3 id=&quot;minimax潜力储备阶段&quot;&gt;MiniMax:潜力储备阶段&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;当前状态&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;未推出专门的端侧小型模型&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;MiniMax-M2(230B总参数,10B激活)相对紧凑,但仍需8x H800/H20 GPU部署&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;技术储备&lt;/strong&gt;:
闫俊杰明确指出:Lightning Attention有助于构建更加&lt;strong&gt;轻量化的模型&lt;/strong&gt;,减少参数数量和计算量,使模型更易于部署在资源受限设备上(手机、嵌入式设备等),”这是未来的趋势”&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;当前优势&lt;/strong&gt;: 主要通过云端API服务,无需端侧部署&lt;/p&gt;

&lt;h3 id=&quot;端侧部署对比&quot;&gt;端侧部署对比&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;端侧模型&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;完整系列(0.5B-7B)&lt;/td&gt;
      &lt;td&gt;无独立系列&lt;/td&gt;
      &lt;td&gt;无独立系列&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;部署场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;手机/座舱/IoT全覆盖&lt;/td&gt;
      &lt;td&gt;主要汽车(合作)&lt;/td&gt;
      &lt;td&gt;云端API为主&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;芯片支持&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;全平台支持&lt;/td&gt;
      &lt;td&gt;依赖合作伙伴&lt;/td&gt;
      &lt;td&gt;未明确&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;落地案例&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;5大内部生态应用&lt;/td&gt;
      &lt;td&gt;吉利、OPPO合作&lt;/td&gt;
      &lt;td&gt;无端侧案例&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术成熟度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★☆☆☆&lt;/td&gt;
      &lt;td&gt;★☆☆☆☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;未来潜力&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;持续优化&lt;/td&gt;
      &lt;td&gt;依赖合作伙伴&lt;/td&gt;
      &lt;td&gt;Lightning Attention储备&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯在端侧部署上具有压倒性优势&lt;/strong&gt;,完整产品矩阵+生态落地&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰端侧能力薄弱&lt;/strong&gt;,依赖外部合作&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax暂未布局端侧&lt;/strong&gt;,但Lightning Attention技术为未来轻量化提供可能&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;六工程能力与商业化从技术到变现的距离&quot;&gt;六、工程能力与商业化:从技术到变现的距离&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元生态变现&quot;&gt;腾讯混元:生态变现&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;工程能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;深度整合微信、QQ、腾讯会议、腾讯文档等&lt;strong&gt;600+业务线&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;混元-A13B日均请求超&lt;strong&gt;1.3亿次&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;腾讯云提供算力和工程化体系支撑&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;商业化路径&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;内部变现&lt;/strong&gt;: 为腾讯业务赋能&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;对外API&lt;/strong&gt;: 腾讯云API服务&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;C端应用&lt;/strong&gt;: 腾讯元宝&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;工程优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;规模化验证: 海量业务场景验证模型能力&lt;/li&gt;
  &lt;li&gt;快速迭代: 基于真实反馈持续优化&lt;/li&gt;
  &lt;li&gt;成本控制: 自有算力降低成本&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;阶跃星辰合作伙伴生态-1&quot;&gt;阶跃星辰:合作伙伴生态&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;工程能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;技术迭代速度极快&lt;/strong&gt;: 成立2年发布16款多模态模型&lt;/li&gt;
  &lt;li&gt;JuiceFS存储平台支持模型训练、推理部署、跨云分发&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;合作生态&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;汽车: 吉利汽车集团&lt;/li&gt;
  &lt;li&gt;手机: OPPO&lt;/li&gt;
  &lt;li&gt;机器人: 智元机器人&lt;/li&gt;
  &lt;li&gt;云平台: 火山引擎、阿里云、华为昇腾&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;商业化劣势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;缺乏自有大规模应用场景&lt;/li&gt;
  &lt;li&gt;依赖外部合作伙伴商业化&lt;/li&gt;
  &lt;li&gt;工程化经验积累相对有限&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;minimax全球化商业化&quot;&gt;MiniMax:全球化商业化&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;工程能力&lt;/strong&gt;(极致效率):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;全员&lt;strong&gt;385人&lt;/strong&gt;,研发占比&lt;strong&gt;73.8%&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;研发成本仅为OpenAI的1%&lt;/strong&gt;(5亿美元 vs 400-550亿美元)&lt;/li&gt;
  &lt;li&gt;训练云计算开支占收入比从2023年的1365%优化到2025年前9个月的&lt;strong&gt;266.5%&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;毛利率从2023年的-24.7%提升至2025年前9个月的&lt;strong&gt;23.3%&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;商业化路径&lt;/strong&gt;(最成功):&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;C端应用&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;&lt;strong&gt;Talkie&lt;/strong&gt;: 角色AI聊天应用,累计下载近1400万,月活接近Character.ai的60%,贡献大部分收入&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;Hailuo AI&lt;/strong&gt;(海螺AI): 视频生成应用,2024年10月至2025年3月全球访问量第一,超越Sora和Runway&lt;/li&gt;
      &lt;li&gt;11月海外版访问量1635万,国内版258万&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;B端服务&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;开放平台注册企业客户和开发者超&lt;strong&gt;5万&lt;/strong&gt;&lt;/li&gt;
      &lt;li&gt;合作覆盖&lt;strong&gt;200+国家和地区&lt;/strong&gt;&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;收入增长&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;2025年前9个月收入5343.7万美元(约3.76亿人民币),同比增长&lt;strong&gt;170%+&lt;/strong&gt;&lt;/li&gt;
      &lt;li&gt;付费用户从2023年的约11.97万增至2024年的约65.03万,2025年前9个月进一步攀升至约&lt;strong&gt;177.16万&lt;/strong&gt;&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;全球化&lt;/strong&gt;:
    &lt;ul&gt;
      &lt;li&gt;&lt;strong&gt;海外市场收入占比超70%&lt;/strong&gt;&lt;/li&gt;
      &lt;li&gt;全球用户超&lt;strong&gt;1.5亿&lt;/strong&gt;&lt;/li&gt;
      &lt;li&gt;与全球终端用户每天交互&lt;strong&gt;30亿次&lt;/strong&gt;&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;IPO进展&lt;/strong&gt;: 2025年12月通过港交所聆讯,预计净收入达7000万美元&lt;/p&gt;

&lt;h3 id=&quot;工程与商业化对比&quot;&gt;工程与商业化对比&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;团队规模&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;大型&lt;/td&gt;
      &lt;td&gt;中型&lt;/td&gt;
      &lt;td&gt;385人(最精简)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;研发占比&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;高&lt;/td&gt;
      &lt;td&gt;73.8%&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;日均调用&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;1.3亿+&lt;/td&gt;
      &lt;td&gt;未公开&lt;/td&gt;
      &lt;td&gt;30亿交互&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;业务场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;600+内部业务&lt;/td&gt;
      &lt;td&gt;外部合作&lt;/td&gt;
      &lt;td&gt;C端应用+B端API&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;付费用户&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;177.16万(2025前9月)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;全球用户&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;1.5亿+&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;收入增长&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;170%+&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;海外占比&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;低&lt;/td&gt;
      &lt;td&gt;未知&lt;/td&gt;
      &lt;td&gt;70%+&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;毛利率&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;未披露&lt;/td&gt;
      &lt;td&gt;23.3%(2025前9月)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;研发效率&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;资源充足&lt;/td&gt;
      &lt;td&gt;快速迭代&lt;/td&gt;
      &lt;td&gt;OpenAI的1%成本&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;商业化&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;生态变现&lt;/td&gt;
      &lt;td&gt;合作伙伴&lt;/td&gt;
      &lt;td&gt;&lt;strong&gt;全球化C端+B端&lt;/strong&gt;&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: 工程能力最强,生态变现,但国际化较弱&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: 技术迭代快,但商业化依赖合作,独立变现能力待验证&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;: &lt;strong&gt;商业化能力最强&lt;/strong&gt;,全球化领先,极致效率,已实现规模化盈利路径&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;七技术预判准确性谁看得更远&quot;&gt;七、技术预判准确性:谁看得更远?&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元务实派&quot;&gt;腾讯混元:务实派&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;2024年的预测&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;长上下文将成为核心能力 ✅&lt;/li&gt;
  &lt;li&gt;RAG技术将变革企业AI应用 ✅&lt;/li&gt;
  &lt;li&gt;Agent平台将成为重点 ✅&lt;/li&gt;
  &lt;li&gt;多模态能力将深度融合 ✅&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;2025年实际表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 推出256K长上下文能力&lt;/li&gt;
  &lt;li&gt;✅ 发布腾讯元器Agent开发平台&lt;/li&gt;
  &lt;li&gt;✅ 混元Turbo S进入全球前八(Chatbot Arena)&lt;/li&gt;
  &lt;li&gt;✅ 3D世界模型开源&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;预判特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;务实准确,基于业务需求&lt;/li&gt;
  &lt;li&gt;聚焦落地,”从落地可用到智能协同”&lt;/li&gt;
  &lt;li&gt;预测与行业主流趋势一致&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;评分&lt;/strong&gt;: ★★★★☆ (准确但不算前瞻,更多是跟随行业趋势)&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰前瞻派&quot;&gt;阶跃星辰:前瞻派&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;姜大昕2024年的预测&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;2025年是Agent元年&lt;/strong&gt; ✅✅&lt;/li&gt;
  &lt;li&gt;Agent爆发需要两大条件:&lt;strong&gt;多模态能力+推理能力&lt;/strong&gt; ✅✅&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;智能终端&lt;/strong&gt;(汽车、手机、机器人)是最重要的Agent落地场景 ✅&lt;/li&gt;
  &lt;li&gt;汽车是”最关键的Agent落地场景” ✅&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;2025年实际表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅✅ Agent概念确实在2025年爆发,成为行业最热话题&lt;/li&gt;
  &lt;li&gt;✅✅ 多模态和推理能力在2024年突破(DeepSeek-R1等),为Agent铺路&lt;/li&gt;
  &lt;li&gt;✅ 与吉利、OPPO等合作,抢占智能终端Agent赛道&lt;/li&gt;
  &lt;li&gt;✅ 推出Step R-mini推理模型和Step 3多模态模型,技术路线与预判完全吻合&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;预判特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;非常准确&lt;/strong&gt;,提前1年准确预判Agent爆发时间点和必要条件&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;前瞻性强&lt;/strong&gt;,在行业普遍关注纯文本对话时,坚定布局多模态&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;战略清晰&lt;/strong&gt;,明确聚焦智能终端四大场景&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;评分&lt;/strong&gt;: ★★★★★ (前瞻性和准确性俱佳,提前布局验证预判)&lt;/p&gt;

&lt;h3 id=&quot;minimax颠覆派&quot;&gt;MiniMax:颠覆派&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;闫俊杰2024-2025年的判断&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;2025年是AI Agent大放异彩的时代&lt;/strong&gt; ✅&lt;/li&gt;
  &lt;li&gt;AI领域会多玩家共存,不会被垄断 ✅&lt;/li&gt;
  &lt;li&gt;通过算法优化,模型推理成本未来1-2年可再降一个数量级 ✅(MiniMax自身验证)&lt;/li&gt;
  &lt;li&gt;单一模型优势减弱,多Agent系统成为主流 ✅&lt;/li&gt;
  &lt;li&gt;AGI一定会实现,将服务大众 ⏳(待验证)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;Lightning Attention将成为AI Agent时代的新基建&lt;/strong&gt; ⏳(行业共识尚未形成,但技术路径正确)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;2025年实际表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 1月开源MiniMax-01系列,首次大规模实现线性注意力机制&lt;/li&gt;
  &lt;li&gt;✅ MiniMax Agent发布,验证多Agent协作系统&lt;/li&gt;
  &lt;li&gt;✅ 成本降低路径验证:研发成本仅OpenAI的1%,毛利率从-24.7%升至23.3%&lt;/li&gt;
  &lt;li&gt;✅ 400万token超长上下文,为Agent时代提供技术支撑&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;预判特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;颠覆性思考&lt;/strong&gt;,挑战Transformer主流架构&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;务实验证&lt;/strong&gt;,通过自身实践验证成本优化路径&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;长期主义&lt;/strong&gt;,押注线性注意力作为未来基础架构&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;评分&lt;/strong&gt;: ★★★★★ (技术颠覆性最强,成本优化路径最清晰,但架构革命尚需行业验证)&lt;/p&gt;

&lt;h3 id=&quot;技术预判对比&quot;&gt;技术预判对比&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;预判风格&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;务实、业务导向&lt;/td&gt;
      &lt;td&gt;前瞻、趋势洞察&lt;/td&gt;
      &lt;td&gt;颠覆、技术革命&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;准确度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;高(基于内部需求)&lt;/td&gt;
      &lt;td&gt;非常高(提前1年判断)&lt;/td&gt;
      &lt;td&gt;高(自我验证)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;前瞻性&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★☆☆&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;落地能力&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★★☆☆&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;风险偏好&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;稳健&lt;/td&gt;
      &lt;td&gt;激进押注&lt;/td&gt;
      &lt;td&gt;激进颠覆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;代表预判&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;“RAG变革企业AI”&lt;/td&gt;
      &lt;td&gt;“2025是Agent元年”&lt;/td&gt;
      &lt;td&gt;“Lightning Attention新基建”&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: 准确但保守,跟随行业趋势&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: &lt;strong&gt;前瞻性最强&lt;/strong&gt;,提前1年准确预判Agent爆发&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;: &lt;strong&gt;技术颠覆性最强&lt;/strong&gt;,但架构革命需要时间验证&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;八未来潜力研判谁能笑到最后&quot;&gt;八、未来潜力研判:谁能笑到最后?&lt;/h2&gt;

&lt;h3 id=&quot;短期1-2年腾讯稳健领先&quot;&gt;短期(1-2年):腾讯稳健领先&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;腾讯混元的优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 600+业务深度整合,规模化应用最成熟&lt;/li&gt;
  &lt;li&gt;✅ 端侧部署能力最完善,抢占移动化先机&lt;/li&gt;
  &lt;li&gt;✅ 企业级Agent平台,契合B端市场需求&lt;/li&gt;
  &lt;li&gt;✅ 生态数据护城河深厚&lt;/li&gt;
  &lt;li&gt;✅ 资源充足,抗风险能力强&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;潜在风险&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;⚠️ 国际化能力弱,主要服务国内市场&lt;/li&gt;
  &lt;li&gt;⚠️ 创新激进度不如创业公司&lt;/li&gt;
  &lt;li&gt;⚠️ 大公司体系可能限制快速迭代&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;短期预判&lt;/strong&gt;: &lt;strong&gt;腾讯在1-2年内综合实力最强&lt;/strong&gt;,生态整合和端侧部署优势明显,适合企业服务和消费者应用市场。&lt;/p&gt;

&lt;h3 id=&quot;中期3-5年阶跃星辰赌性最大&quot;&gt;中期(3-5年):阶跃星辰赌性最大&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;阶跃星辰的潜力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 智能终端Agent赛道前瞻布局&lt;/li&gt;
  &lt;li&gt;✅ 如果汽车、机器人等场景爆发,技术路线完美契合&lt;/li&gt;
  &lt;li&gt;✅ 多模态全栈能力(语音、视频、图像)&lt;/li&gt;
  &lt;li&gt;✅ 技术迭代速度快,2年16款模型&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;关键挑战&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;❌ 端侧部署能力薄弱,依赖合作伙伴&lt;/li&gt;
  &lt;li&gt;❌ 工程化经验不足,规模化验证缺失&lt;/li&gt;
  &lt;li&gt;❌ 商业化路径不清晰,依赖外部合作&lt;/li&gt;
  &lt;li&gt;❌ 如果智能终端Agent场景爆发慢于预期,将面临现金流压力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;中期预判&lt;/strong&gt;: &lt;strong&gt;阶跃星辰是高风险高回报的押注&lt;/strong&gt;。如果智能汽车、具身智能在3-5年内爆发,阶跃星辰将获得巨大回报;但如果场景落地缓慢,可能面临商业化困境。&lt;strong&gt;核心变数是智能终端市场成熟速度&lt;/strong&gt;。&lt;/p&gt;

&lt;h3 id=&quot;长期5-10年minimax想象空间最大&quot;&gt;长期(5-10年):MiniMax想象空间最大&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;MiniMax的颠覆性潜力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅✅ &lt;strong&gt;Lightning Attention架构革命&lt;/strong&gt;:如果线性注意力成为行业共识,MiniMax将占据技术制高点&lt;/li&gt;
  &lt;li&gt;✅✅ &lt;strong&gt;全球化能力&lt;/strong&gt;:海外收入占70%+,1.5亿全球用户,商业化路径最成熟&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;极致效率&lt;/strong&gt;:研发成本仅OpenAI的1%,小团队大产出,可持续性强&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;超长上下文优势&lt;/strong&gt;:400万token为Agent时代提供技术支撑&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;商业化验证&lt;/strong&gt;:C端应用(Talkie、Hailuo AI)已实现规模化盈利&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;IPO后资金&lt;/strong&gt;:即将上市,获得资本市场支持&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;关键挑战&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;⚠️ Lightning Attention尚未成为行业共识,Transformer生态强大&lt;/li&gt;
  &lt;li&gt;⚠️ 端侧部署暂未布局,移动化能力缺失&lt;/li&gt;
  &lt;li&gt;⚠️ 团队规模小(385人),能否持续高强度竞争存疑&lt;/li&gt;
  &lt;li&gt;⚠️ 闭源为主策略,开源社区影响力需要时间积累&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;长期预判&lt;/strong&gt;: &lt;strong&gt;MiniMax具有最大的想象空间和颠覆性潜力&lt;/strong&gt;。如果Lightning Attention架构革命成功,MiniMax将成为”AI时代的新Transformer”;如果失败,仍可凭借全球化商业能力和极致效率成为一家优秀的AI公司,但难以挑战行业格局。&lt;strong&gt;核心变数是架构革命能否被行业接受&lt;/strong&gt;。&lt;/p&gt;

&lt;h3 id=&quot;三种路径三种未来&quot;&gt;三种路径,三种未来&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
      &lt;th&gt;MiniMax&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;路径定位&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;生态整合&lt;/td&gt;
      &lt;td&gt;垂直突破&lt;/td&gt;
      &lt;td&gt;全球化+架构革命&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;短期(1-2年)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★★☆☆&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;中期(3-5年)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★☆(高风险高回报)&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;长期(5-10年)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★★(颠覆性潜力)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;核心优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;生态+资源&lt;/td&gt;
      &lt;td&gt;前瞻布局&lt;/td&gt;
      &lt;td&gt;效率+全球化+架构创新&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;最大风险&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;国际化弱&lt;/td&gt;
      &lt;td&gt;商业化依赖&lt;/td&gt;
      &lt;td&gt;架构革命被拒&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;成功关键&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;保持创新速度&lt;/td&gt;
      &lt;td&gt;智能终端市场爆发&lt;/td&gt;
      &lt;td&gt;Lightning Attention被接受&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;适合场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;企业服务、国内消费&lt;/td&gt;
      &lt;td&gt;智能汽车、机器人&lt;/td&gt;
      &lt;td&gt;全球C端、Agent时代&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;h3 id=&quot;终极研判三足鼎立各有千秋&quot;&gt;终极研判:三足鼎立,各有千秋&lt;/h3&gt;

&lt;p&gt;这不是一个零和博弈的问题,三家公司代表了三种截然不同的发展路径:&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;腾讯混元&lt;/strong&gt;: “我有生态,你来用我的能力”
    &lt;ul&gt;
      &lt;li&gt;&lt;strong&gt;最适合&lt;/strong&gt;: 需要稳定企业级服务、丰富生态整合的场景&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;未来定位&lt;/strong&gt;: 中国市场的AI基础设施提供商&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: “我有技术,我们一起定义未来场景”
    &lt;ul&gt;
      &lt;li&gt;&lt;strong&gt;最适合&lt;/strong&gt;: 探索智能终端新场景、快速技术迭代&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;未来定位&lt;/strong&gt;: 智能终端Agent领域的技术领军者(如果场景爆发)&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;: “我要颠覆游戏规则,服务全球用户”
    &lt;ul&gt;
      &lt;li&gt;&lt;strong&gt;最适合&lt;/strong&gt;: 全球化C端应用、超长上下文Agent任务&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;未来定位&lt;/strong&gt;: 全球化AI公司 + 潜在的架构革命者&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;最可能的未来&lt;/strong&gt;: 中国AI大模型市场足够大,可以容纳三种路径的成功。但&lt;strong&gt;MiniMax的想象空间和颠覆性潜力最大&lt;/strong&gt;,如果Lightning Attention架构革命成功,将重新定义AI时代的技术底座;即使失败,其全球化商业能力和极致效率也能确保成为一家优秀的AI公司。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;对开发者和企业的建议&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;需要稳定服务+生态整合&lt;/strong&gt;: 选腾讯混元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;探索智能终端新场景&lt;/strong&gt;: 选阶跃星辰&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;追求超长上下文+全球化+技术前沿&lt;/strong&gt;: 选MiniMax&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;对投资者的建议&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;稳健型&lt;/strong&gt;: 腾讯(已上市,生态护城河深)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;风险偏好型&lt;/strong&gt;: 阶跃星辰(高风险高回报,赌智能终端爆发)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;成长+颠覆型&lt;/strong&gt;: MiniMax(即将IPO,全球化+架构革命双重潜力)&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;结语竞争的本质是共同推动进步&quot;&gt;结语:竞争的本质是共同推动进步&lt;/h2&gt;

&lt;p&gt;2025年的中国AI赛道,不再是简单的参数军备竞赛,而是三种路径的深度博弈:&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;代表大厂的资源整合和生态优势&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;代表创业公司的前瞻布局和垂直突破&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MiniMax&lt;/strong&gt;代表极致效率和技术颠覆的全球化路线&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;这三家公司的竞争,本质上是在回答同一个问题:&lt;strong&gt;AI的未来在哪里?&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;是在生态整合中赋能千行百业?(腾讯)&lt;/li&gt;
  &lt;li&gt;是在智能终端中成为人类的智能伙伴?(阶跃星辰)&lt;/li&gt;
  &lt;li&gt;还是在架构革命中重新定义AI的技术底座?(MiniMax)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;答案可能是:&lt;strong&gt;三者皆是&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;正如闫俊杰所说,”AI领域一定会有多个玩家持续存在”。竞争不是为了消灭对手,而是通过不同路径的探索,共同推动技术进步和场景落地。&lt;/p&gt;

&lt;p&gt;对于中国AI产业而言,这种”三足鼎立”的格局是健康的:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;有大厂的稳健和资源&lt;/li&gt;
  &lt;li&gt;有创业公司的激进和创新&lt;/li&gt;
  &lt;li&gt;有全球化公司的效率和颠覆&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;最终,受益的是整个生态和亿万用户。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;未来已来,让我们拭目以待。&lt;/strong&gt;&lt;/p&gt;

&lt;hr /&gt;

&lt;h2 id=&quot;参考来源&quot;&gt;参考来源&lt;/h2&gt;

&lt;p&gt;Sources:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/06/302762.html&quot;&gt;腾讯混元推出首款开源混合推理模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/08/318288.html&quot;&gt;手机也能跑大模型,腾讯混元推出多款小尺寸开源模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/05/286237.html&quot;&gt;腾讯大模型战略首次全景亮相&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.sfccn.com/2025/2-22/1NMDE0NDlfMTk5Mzg1Ng.html&quot;&gt;阶跃星辰CEO姜大昕:进入Agent发展阶段,落地智能终端&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.ifanr.com/1615369&quot;&gt;最低调的「AI 六小龙」阶跃星辰&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://testerhome.com/topics/41597&quot;&gt;技术详解:阶跃星辰开源语音交互和视频生成模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.ifanr.com/1647849&quot;&gt;MiniMax 闫俊杰和罗永浩四小时访谈&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.infoq.cn/article/4dfzSRWELNTPwyDfAjf7&quot;&gt;385人、平均95后,MiniMax百亿估值冲刺IPO&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.minimaxi.com/news/minimax-01-系列&quot;&gt;MiniMax-01 is Now Open-Source: Scaling Lightning Attention&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.aitop100.cn/infomation/details/27603.html&quot;&gt;MiniMax Agent深度评测&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.21jingji.com/article/20241023/herald/244f291c7e2cd0ee7bec2ade12ba2403.html&quot;&gt;国产AI出海跑出黑马,MiniMax借海螺AI爆火海外&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/12/363445.html&quot;&gt;火线解析MiniMax招股书&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.infoq.cn/article/nltymm3c7qkjy1czhmvu&quot;&gt;开源首秀就放大招!MiniMax重磅更新两款大模型&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</content>
 </entry>
 
 <entry>
   <title>豆包、千问、元宝：中国AI应用三国杀的用户视角深度拆解</title>
   <link href="https://loredunk.github.io//blog/2026/01/15/china-ai-apps-user-experience-doubao-qwen-yuanbao/"/>
   <updated>2026-01-15T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2026/01/15/china-ai-apps-user-experience-doubao-qwen-yuanbao</id>
   <content type="html">&lt;p&gt;2025年的中国AI市场,不再是技术参数的军备竞赛,而是演变成了一场真刀真枪的用户争夺战。豆包(字节)、千问(阿里)、元宝(腾讯)三大厂牌的AI应用,各自用不同的产品哲学,试图定义”好用的AI”该是什么样。作为一个深度使用者,我想从技术感知、使用体验、产品布局到市场判断,聊聊这场AI应用三国杀的真实战况。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;一技术感知用户能感受到的智能&quot;&gt;一、技术感知:用户能感受到的”智能”&lt;/h2&gt;

&lt;h3 id=&quot;豆包毫秒级响应的创意王者&quot;&gt;豆包:毫秒级响应的创意王者&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;技术印象&lt;/strong&gt;:
第一次用豆包,最直观的感受就是&lt;strong&gt;快&lt;/strong&gt;。不是那种”还行吧”的快,是真正的毫秒级响应。你刚输入完问题,答案几乎瞬间就蹦出来了。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心技术特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;豆包1.6模型&lt;/strong&gt;:复杂推理、竞赛级数学、多轮对话和指令遵循能力跻身全球前列&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;日均tokens调用量&lt;/strong&gt;:超过16.4万亿,较2024年5月首次发布时增长&lt;strong&gt;137倍&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;幻觉率&lt;/strong&gt;:仅4%,准确率96%,在中文大模型忠实性幻觉测评中排名&lt;strong&gt;全球第一&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;MoE架构&lt;/strong&gt;:稀疏专家混合模型,性能杠杆提升至7倍,用较小激活参数超越Llama-3.1-405B&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;多模态能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;视频生成:Seedance 1.0 Pro在全球文生视频、图生视频双榜领先,5秒1080P视频成本仅&lt;strong&gt;3.67元&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;文生图:2.1版本业界率先将汉字生成和一句话P图推向产品化&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;定价策略&lt;/strong&gt;:
按”输入长度”区间定价,客户使用成本降至豆包1.5深度思考模型或DeepSeek R1的&lt;strong&gt;三分之一&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;用户感知&lt;/strong&gt;:
当你用豆包生成一段短视频脚本或者创意文案时,那种”行云流水”的感觉是其他产品难以比拟的。它不会让你等,更不会让你觉得”这AI是不是在思考人生”。&lt;/p&gt;

&lt;h3 id=&quot;千问全能型选手的理性思考&quot;&gt;千问:全能型选手的理性思考&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;技术印象&lt;/strong&gt;:
千问给人的感觉是&lt;strong&gt;稳&lt;/strong&gt;。它不像豆包那样急于给答案,而是会思考一下,然后给出一个结构清晰、逻辑严密的回复。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心技术特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;Qwen3系列&lt;/strong&gt;:创新的&lt;strong&gt;双模式设计&lt;/strong&gt;——思考模式(深入逐步推理)+ 非思考模式(快速响应)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;Qwen3-235B-A22B&lt;/strong&gt;:2350亿总参数,仅激活约220亿参数,性能与DeepSeek-R1、OpenAI o1、Gemini-2.5-Pro等顶级模型竞争&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;多语言能力&lt;/strong&gt;:支持&lt;strong&gt;119种语言和方言&lt;/strong&gt;,预训练数据量约36万亿token&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;开源策略&lt;/strong&gt;:从0.6B到235B全系列采用Apache 2.0许可证开源,Qwen系列全球累计下载量突破&lt;strong&gt;6亿&lt;/strong&gt;,衍生模型超过17万&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;多模态能力&lt;/strong&gt;:
Qwen-Omni模型能接收文本、图片、音频、视频等多种模态的组合输入&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;用户感知&lt;/strong&gt;:
千问最独特的地方在于它的”&lt;strong&gt;识图+购物链接&lt;/strong&gt;“功能。你拍张照片,它不仅能准确识别物体,还会自动挂上淘宝、闲鱼、1688的商品链接。这不是简单的技术堆砌,而是将AI能力转化为”一站式”闭环服务的典范。&lt;/p&gt;

&lt;h3 id=&quot;元宝生态整合的实用主义&quot;&gt;元宝:生态整合的实用主义&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;技术印象&lt;/strong&gt;:
元宝给我的感觉是&lt;strong&gt;实&lt;/strong&gt;。它可能不是技术参数最炫酷的,但当你真正用它解决实际问题时,会发现它总能”刚好够用”。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心技术特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;混元2.0&lt;/strong&gt;:406B总参数,32B激活,支持&lt;strong&gt;256K超长上下文&lt;/strong&gt;(约50万字)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;DeepSeek-R1集成&lt;/strong&gt;(2025年2月):用户可选择混元或DeepSeek模型对话&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;RAG技术&lt;/strong&gt;:法律文档分析、代码审计效率提升&lt;strong&gt;300%&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;端侧模型&lt;/strong&gt;:完整0.5B-7B模型矩阵,支持腾讯手机管家(毫秒级垃圾短信拦截)、腾讯智能座舱、搜狗输入法等&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;核心优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;微信生态打通&lt;/strong&gt;:深度整合微信公众号内容库,可直接调用公众号、视频号等优质内容资源&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;联网搜索&lt;/strong&gt;:覆盖微信公众号等腾讯生态内容及互联网权威信源&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;用户感知&lt;/strong&gt;:
元宝最杀手锏的功能是&lt;strong&gt;微信生态无缝衔接&lt;/strong&gt;。你可以直接在微信里调用它,处理微信文档特别方便。当你需要总结一篇公众号文章或者整理会议纪要时,元宝的精准度和便捷性是其他产品难以替代的。&lt;/p&gt;

&lt;h3 id=&quot;技术感知对比表&quot;&gt;技术感知对比表&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;豆包&lt;/th&gt;
      &lt;th&gt;千问&lt;/th&gt;
      &lt;th&gt;元宝&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;响应速度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★★(毫秒级)&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;准确率&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;96%(幻觉率4%)&lt;/td&gt;
      &lt;td&gt;高&lt;/td&gt;
      &lt;td&gt;高&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;多模态&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★★(视频、图像领先)&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;长上下文&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;未明确披露&lt;/td&gt;
      &lt;td&gt;未明确披露&lt;/td&gt;
      &lt;td&gt;256K(50万字)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;开源&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;部分开源&lt;/td&gt;
      &lt;td&gt;全系列开源(0.6B-235B)&lt;/td&gt;
      &lt;td&gt;部分开源&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;成本&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;极低(1/3的DeepSeek R1)&lt;/td&gt;
      &lt;td&gt;中等&lt;/td&gt;
      &lt;td&gt;中等&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;特色技术&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;毫秒响应+低成本&lt;/td&gt;
      &lt;td&gt;双模式+多语言+购物链接&lt;/td&gt;
      &lt;td&gt;微信生态+RAG&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;豆包&lt;/strong&gt;在速度和成本上领先,适合高频创意场景&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;千问&lt;/strong&gt;在多语言和开源生态上最强,适合全球化和开发者&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;元宝&lt;/strong&gt;在生态整合上无可替代,适合微信重度用户&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;二使用体验那些让人上瘾的细节&quot;&gt;二、使用体验:那些让人”上瘾”的细节&lt;/h2&gt;

&lt;h3 id=&quot;豆包创意工作者的效率神器&quot;&gt;豆包:创意工作者的效率神器&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;最擅长的场景&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;短视频脚本生成&lt;/strong&gt;:输入主题和风格,豆包能快速生成结构完整、节奏流畅的脚本,甚至连镜头切换都帮你想好了&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;创意文案&lt;/strong&gt;:无论是小红书种草文、朋友圈文案,还是广告Slogan,豆包的”文案质感”很在线&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;AI绘画&lt;/strong&gt;:人像面部特征清晰、背景自然、关键词识别率高&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;真实体验&lt;/strong&gt;:
作为内容创作者,豆包最让我惊喜的是它对&lt;strong&gt;中文语境的理解&lt;/strong&gt;。你让它写个”接地气但不俗气”的文案,它真的能get到那个微妙的平衡点。而且它的UI设计很舒适,选项简单、设计简洁,对容易心浮气躁的用户很友好。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;不足之处&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;在写作深度和创意度上仍有提升空间,有时候会显得”套路化”&lt;/li&gt;
  &lt;li&gt;长文档处理能力相对较弱&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;用户数据&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;DAU&lt;/strong&gt;:突破1亿,成为字节史上推广费用&lt;strong&gt;最少&lt;/strong&gt;的破亿产品&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;月活&lt;/strong&gt;:1.72亿(2025年10月),超过DeepSeek的1.44亿,全国用户量第一&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;周活&lt;/strong&gt;:1.55亿,稳居原生AI市场榜首&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;市场份额&lt;/strong&gt;:IDC报告显示,豆包大模型在中国公有云大模型市场份额排名第一,占比&lt;strong&gt;46.4%&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;生态规模&lt;/strong&gt;:Coze平台汇聚超100万活跃开发者,发布超1000万个智能体&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;千问全场景覆盖的理性助手&quot;&gt;千问:全场景覆盖的理性助手&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;最擅长的场景&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;多模态识别+购物链接&lt;/strong&gt;:拍照识物后自动挂淘宝/闲鱼/1688链接,将AI变成购物助手&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;专业报告生成&lt;/strong&gt;:结构清晰、逻辑严密,适合企业级文档&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;多语言翻译&lt;/strong&gt;:支持119种语言,全球化场景无敌&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;代码生成&lt;/strong&gt;:社交媒体反馈,代码生成能力表现优异&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;真实体验&lt;/strong&gt;:
千问给我最深刻的印象是它的&lt;strong&gt;“会办事”能力&lt;/strong&gt;。你问它一个问题,它不只是回答你,还会主动帮你想下一步该怎么办。比如你问”怎么去杭州旅游”,它不仅给你景点推荐,还直接帮你规划路线、推荐酒店,甚至给出购票链接。&lt;/p&gt;

&lt;p&gt;阿里明确表示,对千问的定位不止于”聊天”,更看重”办事”能力。团队计划将地图、外卖、订票、办公等各类生活场景全面接入千问。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;不足之处&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;早期版本活跃率较低:2024年上半年通义APP的活跃率(DAU/MAU)仅&lt;strong&gt;14.3%&lt;/strong&gt;,月人均使用天数4.3天&lt;/li&gt;
  &lt;li&gt;C端产品打磨相对较晚,用户粘性有待提升&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;用户数据&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;全球下载量&lt;/strong&gt;:Qwen系列模型在全球主要模型社区累计下载量突破&lt;strong&gt;6亿&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;衍生模型&lt;/strong&gt;:超过17万个&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;月活增速&lt;/strong&gt;:单月MAU增速&lt;strong&gt;149.03%&lt;/strong&gt;,成为最大黑马&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;公测成绩&lt;/strong&gt;:2025年11月17日公测仅23天,月活跃用户数突破&lt;strong&gt;3000万&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;App Store排名&lt;/strong&gt;:免费总榜第3名&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;战略意义&lt;/strong&gt;:
阿里将千问视为”AI生活入口”,目标是成为一个”会聊天能办事”的个人AI助手,打造未来的”AI时代Android”。&lt;/p&gt;

&lt;h3 id=&quot;元宝微信生态的深度整合者&quot;&gt;元宝:微信生态的深度整合者&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;最擅长的场景&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;微信文档处理&lt;/strong&gt;:总结公众号文章、整理微信群聊天记录、生成会议纪要&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;语音助手&lt;/strong&gt;:语音功能特别好,可直接在微信里调用&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;AI搜索&lt;/strong&gt;:覆盖微信公众号等腾讯生态内容,检索结果、索引数据、回答质量表现优秀&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;长文本总结&lt;/strong&gt;:文章总结精准度高,对不同部分进行归纳,基本还原文章大意&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;真实体验&lt;/strong&gt;:
元宝最大的”杀手锏”就是&lt;strong&gt;微信生态无缝衔接&lt;/strong&gt;。作为微信重度用户,我经常需要总结公众号文章、整理工作群的讨论内容。元宝可以直接调用微信公众号、视频号的内容,这是其他产品无法替代的优势。&lt;/p&gt;

&lt;p&gt;有网友评价:”DeepSeek R1+元宝内的公众号生态,这个组合拳确实是现在的顶峰”。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;不足之处&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;月活较低&lt;/strong&gt;:截至2025年2月底,元宝月活跃用户为1312万,远低于豆包(8198万)和DeepSeek(6181万)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;功能入口深&lt;/strong&gt;:部分功能如文本总结精读、AI搜索等常用工具为了界面美观没有突出,用户反馈”藏得太深”&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;上下文理解不足&lt;/strong&gt;:部分用户反馈存在回答拖沓等问题&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;用户数据&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;月活&lt;/strong&gt;:1312万(2025年2月底)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;DAU增长&lt;/strong&gt;:2025年2-3月,日活激增超&lt;strong&gt;20倍&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;App Store排名&lt;/strong&gt;:2025年3月3日首次登顶苹果中国区免费App下载排行榜第1名,超越DeepSeek&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;市场地位&lt;/strong&gt;:腾讯披露元宝已是TOP3应用&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;战略定位&lt;/strong&gt;:
腾讯是大厂里第一个拥抱DeepSeek并进行应用捆绑的,产品主要使用场景以大学生和办公族的高频需求为主,深度绑定微信生态实现差异化竞争。&lt;/p&gt;

&lt;h3 id=&quot;使用体验对比表&quot;&gt;使用体验对比表&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;豆包&lt;/th&gt;
      &lt;th&gt;千问&lt;/th&gt;
      &lt;th&gt;元宝&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;核心定位&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;创意王者&lt;/td&gt;
      &lt;td&gt;全能助手&lt;/td&gt;
      &lt;td&gt;生活管家&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;最强场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;短视频脚本、创意文案、AI绘画&lt;/td&gt;
      &lt;td&gt;多模态识物+购物、专业报告、多语言&lt;/td&gt;
      &lt;td&gt;微信办公、公众号总结、语音助手&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;UI设计&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;简洁舒适&lt;/td&gt;
      &lt;td&gt;功能丰富&lt;/td&gt;
      &lt;td&gt;微信集成&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;响应速度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;极快(毫秒级)&lt;/td&gt;
      &lt;td&gt;快&lt;/td&gt;
      &lt;td&gt;快&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;生态优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;Coze开发者平台&lt;/td&gt;
      &lt;td&gt;阿里电商生态&lt;/td&gt;
      &lt;td&gt;微信生态&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;月活(2025)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;1.72亿(第1)&lt;/td&gt;
      &lt;td&gt;3000万+(快速增长)&lt;/td&gt;
      &lt;td&gt;1312万(第3)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;适合人群&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;内容创作者、设计师&lt;/td&gt;
      &lt;td&gt;电商用户、企业用户、全球化需求&lt;/td&gt;
      &lt;td&gt;微信重度用户、办公族&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;写创意文案、短视频脚本&lt;/strong&gt; → 豆包&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;网购、多语言、专业报告&lt;/strong&gt; → 千问&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;微信办公、日常生活助手&lt;/strong&gt; → 元宝&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;三产品布局三大厂的战略选择&quot;&gt;三、产品布局:三大厂的战略选择&lt;/h2&gt;

&lt;h3 id=&quot;豆包全栈ai的字节式狂飙&quot;&gt;豆包:全栈AI的字节式狂飙&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;产品矩阵&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;豆包APP&lt;/strong&gt;:C端旗舰应用,DAU破亿&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;Coze平台&lt;/strong&gt;:智能体开发平台,100万+活跃开发者,1000万+智能体&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;火山引擎&lt;/strong&gt;:B端云服务,市场份额46.4%排名第一&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;AIoT生态&lt;/strong&gt;:已接入豆包的AIoT产品出货量超100万台,预计2025年底突破1000万台&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;战略路径&lt;/strong&gt;:
字节的策略是&lt;strong&gt;“全栈AI”&lt;/strong&gt;——从底层模型(豆包大模型)到应用层(豆包APP)再到开发者平台(Coze),形成完整闭环。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;投入力度&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;2024年4-5月广告投放:1500-1750万元&lt;/li&gt;
  &lt;li&gt;6月单次营销活动:1.24亿元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;特点&lt;/strong&gt;:字节历史上所有破亿DAU产品中,豆包的UG(User Growth)、市场推广费用最低&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;差异化优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;极致效率&lt;/strong&gt;:日均tokens调用量16.4万亿,增长137倍&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;成本优势&lt;/strong&gt;:定价策略降至竞品的1/3&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;开发者生态&lt;/strong&gt;:Coze平台快速聚集百万开发者&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;未来布局&lt;/strong&gt;:
字节正在构建一个”AI原生”的生态系统,从内容生产(豆包APP)到内容分发(抖音、今日头条)再到开发者赋能(Coze),形成飞轮效应。&lt;/p&gt;

&lt;h3 id=&quot;千问开源闭环的阿里野心&quot;&gt;千问:开源+闭环的阿里野心&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;产品矩阵&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;千问APP&lt;/strong&gt;:2025年11月17日上线,23天破3000万月活&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;通义系列&lt;/strong&gt;:通义千问(对话)、通义万相(图像)、通义听悟(语音)等全模态产品&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;开源生态&lt;/strong&gt;:Qwen系列0.6B-235B全系列开源,全球下载量6亿+&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阿里云百炼&lt;/strong&gt;:企业级大模型服务平台&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;战略路径&lt;/strong&gt;:
阿里的策略是&lt;strong&gt;“开源+闭环”&lt;/strong&gt;——通过开源建立技术影响力(打造”AI时代的Android”),通过电商闭环实现商业变现。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;集团重组&lt;/strong&gt;:
2024年12月,阿里将AI应用”通义”的产品团队从阿里云智能划入智能信息事业群,标志着从&lt;strong&gt;B端技术工具向C端应用的战略转型&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;差异化优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;识图+购物闭环&lt;/strong&gt;:将AI能力转化为电商流量&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;开源生态&lt;/strong&gt;:17万+衍生模型,开发者基础最强&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;多语言能力&lt;/strong&gt;:119种语言,全球化优势明显&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;全场景接入&lt;/strong&gt;:计划接入地图、外卖、订票、办公等生活场景&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;未来布局&lt;/strong&gt;:
阿里的野心是将千问打造成”AI生活入口”,成为用户日常生活的”超级入口”,从”会聊天”到”能办事”,从AI工具到生活助手。&lt;/p&gt;

&lt;h3 id=&quot;元宝生态协同的腾讯打法&quot;&gt;元宝:生态协同的腾讯打法&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;产品矩阵&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;腾讯元宝APP&lt;/strong&gt;:C端应用,月活1312万&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;混元大模型&lt;/strong&gt;:底层技术,已整合600+腾讯业务线,日均调用1.3亿+&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;腾讯元器&lt;/strong&gt;:企业级Agent开发平台&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;端侧模型&lt;/strong&gt;:0.5B-7B完整矩阵,已落地腾讯手机管家、智能座舱、搜狗输入法等&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;战略路径&lt;/strong&gt;:
腾讯的策略是&lt;strong&gt;“生态协同”&lt;/strong&gt;——不急于做爆款C端应用,而是将AI能力深度整合进微信、QQ、腾讯会议等已有产品,形成生态合力。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;首个拥抱DeepSeek的大厂&lt;/strong&gt;:
2025年2月13日接入DeepSeek-R1模型,成为大厂里第一个拥抱外部顶级模型的玩家,展现出开放态度。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;差异化优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;微信生态无可替代&lt;/strong&gt;:公众号、视频号、微信群内容直接调用&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;端侧部署最完善&lt;/strong&gt;:完整0.5B-7B模型矩阵,已在多个腾讯产品落地&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;企业级能力&lt;/strong&gt;:元器平台支持RAG、工作流、多智能体协作&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;未来布局&lt;/strong&gt;:
腾讯的路线是&lt;strong&gt;“横向整合”&lt;/strong&gt;——不追求单一应用的爆发式增长,而是将AI能力渗透到所有业务线,形成”润物细无声”的生态优势。元宝更像是一个”展示窗口”,真正的战场在微信、QQ等亿级用户产品中。&lt;/p&gt;

&lt;h3 id=&quot;产品布局对比表&quot;&gt;产品布局对比表&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;豆包(字节)&lt;/th&gt;
      &lt;th&gt;千问(阿里)&lt;/th&gt;
      &lt;th&gt;元宝(腾讯)&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;战略定位&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;全栈AI&lt;/td&gt;
      &lt;td&gt;开源+闭环&lt;/td&gt;
      &lt;td&gt;生态协同&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;核心产品&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;豆包APP+Coze&lt;/td&gt;
      &lt;td&gt;千问APP+通义系列&lt;/td&gt;
      &lt;td&gt;元宝APP+混元&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;生态优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;抖音+今日头条&lt;/td&gt;
      &lt;td&gt;淘宝+支付宝+高德&lt;/td&gt;
      &lt;td&gt;微信+QQ&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;B端布局&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;火山引擎(46.4%市场份额)&lt;/td&gt;
      &lt;td&gt;阿里云百炼&lt;/td&gt;
      &lt;td&gt;腾讯云+元器&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;开发者生态&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;Coze(100万+开发者)&lt;/td&gt;
      &lt;td&gt;开源模型(6亿下载)&lt;/td&gt;
      &lt;td&gt;600+内部业务&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;月活(C端)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;1.72亿(第1)&lt;/td&gt;
      &lt;td&gt;3000万+(快速增长)&lt;/td&gt;
      &lt;td&gt;1312万(第3)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;差异化&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;极致效率+低成本&lt;/td&gt;
      &lt;td&gt;开源+购物闭环&lt;/td&gt;
      &lt;td&gt;微信生态+端侧部署&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;未来目标&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;AI原生生态&lt;/td&gt;
      &lt;td&gt;AI生活入口&lt;/td&gt;
      &lt;td&gt;横向整合&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;字节&lt;/strong&gt;走的是”技术-产品-生态”的飞轮模式,速度快、效率高&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阿里&lt;/strong&gt;走的是”开源-流量-变现”的闭环模式,野心大、场景全&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;走的是”生态-整合-协同”的稳健模式,不求爆款、但求渗透&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;四市场判断谁能笑到最后&quot;&gt;四、市场判断:谁能笑到最后?&lt;/h2&gt;

&lt;h3 id=&quot;当前市场格局2025年&quot;&gt;当前市场格局(2025年)&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;用户规模排名&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;豆包&lt;/strong&gt;:1.72亿月活,断层第一&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;DeepSeek&lt;/strong&gt;:1.44亿月活(非大厂产品,不在本文重点讨论)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;千问&lt;/strong&gt;:3000万+月活,单月增速149.03%&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;元宝&lt;/strong&gt;:1312万月活&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;市场份额(B端)&lt;/strong&gt;:
根据IDC报告,&lt;strong&gt;豆包大模型&lt;/strong&gt;在中国公有云大模型市场份额排名第一,占比46.4%。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;App Store表现&lt;/strong&gt;(2025年):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;豆包:第1名&lt;/li&gt;
  &lt;li&gt;千问:第3名&lt;/li&gt;
  &lt;li&gt;元宝:第8名&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;行业现状&lt;/strong&gt;:
在全球百大AI应用中,&lt;strong&gt;71%来自中国企业&lt;/strong&gt;。国内公司开发的AI应用中,32%聚焦AI内容创作与生成领域,字节跳动以自有12款AI APP排在首位。&lt;/p&gt;

&lt;h3 id=&quot;三大玩家的优劣势分析&quot;&gt;三大玩家的优劣势分析&lt;/h3&gt;

&lt;h4 id=&quot;豆包短期霸主中期挑战&quot;&gt;豆包:短期霸主,中期挑战&lt;/h4&gt;

&lt;p&gt;&lt;strong&gt;优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ &lt;strong&gt;用户规模绝对领先&lt;/strong&gt;:1.72亿月活,是第二名的5倍+&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;技术效率最高&lt;/strong&gt;:成本仅竞品1/3,日均tokens调用增长137倍&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;开发者生态强&lt;/strong&gt;:Coze平台100万+开发者,1000万+智能体&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;抖音流量加持&lt;/strong&gt;:字节系产品导流能力强&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;生态闭环不足&lt;/strong&gt;:相比阿里的电商闭环和腾讯的社交闭环,字节的”内容消费”闭环变现路径不够清晰&lt;/li&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;用户粘性待验证&lt;/strong&gt;:快速增长的用户能否长期留存是关键&lt;/li&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;监管风险&lt;/strong&gt;:字节系产品历来是监管重点关注对象&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;中期挑战&lt;/strong&gt;:
豆包的核心挑战是如何将&lt;strong&gt;流量优势转化为商业价值&lt;/strong&gt;。单纯的用户规模不等于盈利能力,字节需要回答:”用户用豆包做什么?为什么要付费?”&lt;/p&gt;

&lt;h4 id=&quot;千问后发黑马潜力巨大&quot;&gt;千问:后发黑马,潜力巨大&lt;/h4&gt;

&lt;p&gt;&lt;strong&gt;优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ &lt;strong&gt;增速最快&lt;/strong&gt;:单月MAU增速149.03%,23天破3000万&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;开源影响力最大&lt;/strong&gt;:6亿全球下载,17万衍生模型&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;电商闭环清晰&lt;/strong&gt;:识图+购物链接,AI直接转化为GMV&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;全场景覆盖&lt;/strong&gt;:计划接入地图、外卖、订票、办公等生活场景&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;多语言优势&lt;/strong&gt;:119种语言,全球化能力最强&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;起步较晚&lt;/strong&gt;:2025年11月才正式上线千问APP,比豆包晚了约1.5年&lt;/li&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;用户粘性低&lt;/strong&gt;:早期版本活跃率仅14.3%,月人均使用天数4.3天&lt;/li&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;C端基因不足&lt;/strong&gt;:阿里擅长B端和电商,C端产品打磨能力相对较弱&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;中期潜力&lt;/strong&gt;:
千问的最大优势是&lt;strong&gt;闭环能力&lt;/strong&gt;。通过识图+购物、地图+订票、外卖+配送等场景,可以将AI工具变成”交易入口”,这是豆包和元宝都做不到的。如果阿里能解决用户粘性问题,千问有可能成为”AI时代的支付宝”。&lt;/p&gt;

&lt;h4 id=&quot;元宝稳健第三生态制胜&quot;&gt;元宝:稳健第三,生态制胜&lt;/h4&gt;

&lt;p&gt;&lt;strong&gt;优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ &lt;strong&gt;微信生态无可替代&lt;/strong&gt;:10亿+微信用户是最大的流量池&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;端侧部署最完善&lt;/strong&gt;:完整0.5B-7B模型矩阵,已在多个产品落地&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;企业级能力强&lt;/strong&gt;:600+业务整合,日均调用1.3亿+&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;开放态度&lt;/strong&gt;:率先接入DeepSeek,不排斥外部模型&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;月活最低&lt;/strong&gt;:1312万,仅为豆包的7.6%&lt;/li&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;产品力待提升&lt;/strong&gt;:功能入口深、上下文理解不足等用户痛点&lt;/li&gt;
  &lt;li&gt;⚠️ &lt;strong&gt;不够激进&lt;/strong&gt;:腾讯的”生态协同”战略意味着元宝APP本身不会是重点&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;中期定位&lt;/strong&gt;:
元宝的真正价值不在于独立APP的用户规模,而在于&lt;strong&gt;作为微信生态的AI能力中台&lt;/strong&gt;。未来元宝可能不会是一个独立的超级APP,而是融入微信、QQ、腾讯会议等产品中,成为”看不见但无处不在”的AI助手。&lt;/p&gt;

&lt;h3 id=&quot;市场终局推演&quot;&gt;市场终局推演&lt;/h3&gt;

&lt;h4 id=&quot;短期1-2年豆包继续领跑千问加速追赶&quot;&gt;短期(1-2年):豆包继续领跑,千问加速追赶&lt;/h4&gt;

&lt;p&gt;&lt;strong&gt;预判&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;豆包&lt;/strong&gt;凭借先发优势和流量加持,继续保持用户规模第一&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;千问&lt;/strong&gt;凭借电商闭环和全场景接入,月活突破1亿,成为最大黑马&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;元宝&lt;/strong&gt;月活缓慢增长至3000-5000万,但更多精力放在生态整合&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;关键变量&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;豆包能否找到清晰的商业变现路径?&lt;/li&gt;
  &lt;li&gt;千问的”会办事”能力能否真正提升用户粘性?&lt;/li&gt;
  &lt;li&gt;元宝如何在微信内实现更深度的功能集成?&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;中期3-5年三足鼎立各有千秋&quot;&gt;中期(3-5年):三足鼎立,各有千秋&lt;/h4&gt;

&lt;p&gt;&lt;strong&gt;预判&lt;/strong&gt;:
中国AI应用市场不会出现”赢家通吃”,而是形成&lt;strong&gt;“三足鼎立,各有千秋”&lt;/strong&gt;的格局:&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;豆包&lt;/strong&gt;:内容创作和信息消费场景的首选,服务创作者和年轻用户&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;千问&lt;/strong&gt;:生活服务和电商场景的首选,服务购物和生活需求&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;元宝&lt;/strong&gt;:办公协同和社交场景的首选,服务企业和微信用户&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;关键趋势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;AI应用从”通用对话工具”演变为”垂直场景入口”&lt;/li&gt;
  &lt;li&gt;生态闭环能力比单纯的模型技术更重要&lt;/li&gt;
  &lt;li&gt;To B和To C市场出现分化,各玩家在不同领域建立壁垒&lt;/li&gt;
&lt;/ul&gt;

&lt;h4 id=&quot;长期5-10年生态之战而非产品之战&quot;&gt;长期(5-10年):生态之战,而非产品之战&lt;/h4&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:
最终的竞争不是”哪个AI更聪明”,而是&lt;strong&gt;“哪个生态更强大”&lt;/strong&gt;。&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;字节生态&lt;/strong&gt;:抖音+今日头条+豆包 = 内容消费闭环&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阿里生态&lt;/strong&gt;:淘宝+支付宝+千问 = 生活服务闭环&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;腾讯生态&lt;/strong&gt;:微信+QQ+元宝 = 社交办公闭环&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;可能的变数&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;监管政策&lt;/strong&gt;:AI应用的数据合规、内容审核、竞争秩序等可能重塑格局&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;技术突破&lt;/strong&gt;:AGI级别的技术突破可能让先发优势归零&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;国际化&lt;/strong&gt;:全球化能力强的玩家(如千问依托多语言优势)可能获得新增长点&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;开源运动&lt;/strong&gt;:如果开源模型质量持续追赶闭源,生态整合能力的重要性将进一步凸显&lt;/li&gt;
&lt;/ol&gt;

&lt;h3 id=&quot;给用户的选择建议&quot;&gt;给用户的选择建议&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;内容创作者/设计师&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;首选:&lt;strong&gt;豆包&lt;/strong&gt;(速度快、创意强、视频生成能力强)&lt;/li&gt;
  &lt;li&gt;备选:千问(多模态能力强)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;电商用户/购物达人&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;首选:&lt;strong&gt;千问&lt;/strong&gt;(识图+购物链接,无缝接入阿里生态)&lt;/li&gt;
  &lt;li&gt;备选:豆包(创意文案可用于种草)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;微信重度用户/办公族&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;首选:&lt;strong&gt;元宝&lt;/strong&gt;(微信生态无缝,公众号总结、会议纪要强)&lt;/li&gt;
  &lt;li&gt;备选:豆包(创意文案、周报生成)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;企业用户/开发者&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;首选:&lt;strong&gt;千问&lt;/strong&gt;(开源生态强,企业级方案成熟)&lt;/li&gt;
  &lt;li&gt;备选:豆包(Coze平台开发者生态好)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;追求极致性价比&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;首选:&lt;strong&gt;豆包&lt;/strong&gt;(成本仅竞品1/3,免费额度大)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;多语言需求/全球化&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;首选:&lt;strong&gt;千问&lt;/strong&gt;(支持119种语言)&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;市场判断总结&quot;&gt;市场判断总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;豆包&lt;/th&gt;
      &lt;th&gt;千问&lt;/th&gt;
      &lt;th&gt;元宝&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;短期(1-2年)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★☆☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;中期(3-5年)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;长期(5-10年)&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;★★★★☆&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
      &lt;td&gt;★★★★★&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;核心优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;用户规模+效率&lt;/td&gt;
      &lt;td&gt;闭环能力+开源&lt;/td&gt;
      &lt;td&gt;生态整合+端侧&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;最大风险&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;商业化不清晰&lt;/td&gt;
      &lt;td&gt;C端基因不足&lt;/td&gt;
      &lt;td&gt;产品力待提升&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;终局定位&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;内容创作入口&lt;/td&gt;
      &lt;td&gt;生活服务入口&lt;/td&gt;
      &lt;td&gt;社交办公入口&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;最终结论&lt;/strong&gt;:
这不是一场”谁干掉谁”的零和博弈,而是一场”各自占领山头”的生态之战。豆包、千问、元宝三者最终可能形成&lt;strong&gt;“三足鼎立,各有千秋”&lt;/strong&gt;的格局,分别服务不同的用户群体和使用场景。&lt;/p&gt;

&lt;p&gt;用户的选择不应该是”用哪一个”,而应该是&lt;strong&gt;“在什么场景用哪一个”&lt;/strong&gt;。&lt;/p&gt;

&lt;h2 id=&quot;结语ai应用的下半场才刚刚开始&quot;&gt;结语:AI应用的下半场,才刚刚开始&lt;/h2&gt;

&lt;p&gt;2025年的AI应用市场,看似已经尘埃落定——豆包断层第一,千问快速追赶,元宝稳健第三。但我认为,这只是上半场的结束,真正的下半场才刚刚开始。&lt;/p&gt;

&lt;p&gt;上半场拼的是&lt;strong&gt;“有没有”&lt;/strong&gt;:谁先做出AI应用,谁先获得用户,谁先建立影响力。&lt;/p&gt;

&lt;p&gt;下半场拼的是&lt;strong&gt;“好不好”&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;AI能否真正解决用户问题,而非只是”看起来很酷”?&lt;/li&gt;
  &lt;li&gt;用户愿不愿意为AI付费,而非只是”免费白嫖”?&lt;/li&gt;
  &lt;li&gt;AI能否融入日常生活,而非只是”尝鲜体验”?&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;从这个角度看:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;豆包&lt;/strong&gt;需要证明,快和便宜之外,能否提供不可替代的价值&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;千问&lt;/strong&gt;需要证明,开源和全能之外,能否让用户真正”离不开”&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;元宝&lt;/strong&gt;需要证明,生态和整合之外,能否打造独立的产品竞争力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;AI的未来不在实验室,不在参数表,而在&lt;strong&gt;每一个普通用户的日常生活&lt;/strong&gt;中。&lt;/p&gt;

&lt;p&gt;谁能让AI从”工具”变成”伙伴”,谁就能笑到最后。&lt;/p&gt;

&lt;hr /&gt;

&lt;h2 id=&quot;参考来源&quot;&gt;参考来源&lt;/h2&gt;

&lt;p&gt;Sources:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;a href=&quot;https://36kr.com/p/3096460520623624&quot;&gt;豆包定价一元的野心：字节跳动打响AI突围战&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://36kr.com/p/3609313072153862&quot;&gt;36氪独家｜豆包DAU破亿&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.rongpm.com/column/ai-doubao-review-1hj4.html&quot;&gt;好饭不怕晚—字节大模型”豆包”深度测评报告&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.doit.com.cn/p/535896.html&quot;&gt;中文大模型幻觉测评：豆包大模型幻觉率仅4%&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.21jingji.com/article/20251120/herald/a09095591eecc16c7c203cce358c9402.html&quot;&gt;千问，阿里的未竟之梦&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.yicai.com/news/102926019.html&quot;&gt;千问一周破千万，阿里敲开”AI时代终极入口”之门&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://help.aliyun.com/zh/model-studio/what-is-qwen-llm&quot;&gt;通义千问大语言模型介绍&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.oschina.net/news/347255/qwenlm-qwen3&quot;&gt;阿里发布 Qwen3 模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://zhuanlan.zhihu.com/p/31658667869&quot;&gt;如何评价爆火的腾讯元宝？&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://m.ofweek.com/ai/2024-05/ART-201700-8330-30636462.html&quot;&gt;腾讯元宝首发体验&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.woshipm.com/evaluating/6119178.html&quot;&gt;深度剖析鹅厂AI：腾讯元宝&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/09/333191.html&quot;&gt;腾讯披露元宝已是TOP3应用&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://jishuzhan.baijing.cn/article/1513&quot;&gt;Kimi爆火，谁制造了大模型的又一次狂欢？&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://m.thepaper.cn/newsDetail_forward_32039963&quot;&gt;豆包、千问、元宝疯狂抢夺下载量&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://blog.csdn.net/MILI_NFT/article/details/147946496&quot;&gt;DeepSeek、元宝Hunyan、文心4.5、豆包深度思考、通义千问：五大AI工具的差异化定位&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.jiemian.com/article/13762003.html&quot;&gt;2025年AI应用大战：豆包断层第一&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://bg.qianzhan.com/trends/detail/506/250218-a70ead78.html&quot;&gt;预见2025：《2025年中国人工智能行业全景图谱》&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</content>
 </entry>
 
 <entry>
   <title>腾讯元宝 vs 阶跃星辰：中国大模型双雄的技术路线深度对比</title>
   <link href="https://loredunk.github.io//blog/2026/01/14/tencent-yuanbao-vs-stepfun-tech-comparison/"/>
   <updated>2026-01-14T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2026/01/14/tencent-yuanbao-vs-stepfun-tech-comparison</id>
   <content type="html">&lt;p&gt;在中国AI大模型竞争格局中,腾讯元宝(背靠混元大模型)和阶跃星辰(StepFun)代表了两种截然不同的发展路径:一个是互联网巨头的全生态整合,一个是创业公司的技术突破。本文将从技术能力、开源策略、工程实力、前瞻预判等多个维度,深度拆解这两家公司的技术竞争力。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;一公司背景与团队实力&quot;&gt;一、公司背景与团队实力&lt;/h2&gt;

&lt;h3 id=&quot;腾讯元宝混元&quot;&gt;腾讯元宝/混元&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;成立背景&lt;/strong&gt;: 腾讯混元大模型是腾讯自研的基础大模型,元宝是基于混元推出的AI智能助手应用。2025年4月,腾讯全面重构混元研发体系,成立&lt;strong&gt;大语言模型部&lt;/strong&gt;和&lt;strong&gt;多模态模型部&lt;/strong&gt;,围绕算力、算法、数据三大核心展开攻坚。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;团队优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;背靠腾讯强大的技术团队和基础设施&lt;/li&gt;
  &lt;li&gt;深度整合微信、QQ等超过600+业务线&lt;/li&gt;
  &lt;li&gt;拥有腾讯云的算力和工程支撑能力&lt;/li&gt;
  &lt;li&gt;可触达腾讯生态海量用户数据&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;阶跃星辰stepfun&quot;&gt;阶跃星辰(StepFun)&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;成立背景&lt;/strong&gt;: 2023年4月成立于上海,短短两年即跻身”AI六小龙”之列。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;核心团队&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;创始人姜大昕&lt;/strong&gt;: 前微软全球副总裁、微软亚洲互联网工程院首席科学家&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;焦斌星&lt;/strong&gt;: 数据负责人,前微软必应引擎核心搜索团队负责人&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;朱亦博&lt;/strong&gt;: 系统负责人,曾在Google和字节跳动任职&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;融资情况&lt;/strong&gt;: 2024年底完成数亿美元B轮融资,获国有资本和腾讯等机构支持&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;技术特色&lt;/strong&gt;: 自成立以来,在两年内发布了16款多模态大模型,涵盖语音识别、语音生成、多模态理解、图像及视频生成全栈能力。&lt;/p&gt;

&lt;h2 id=&quot;二数据资源对比&quot;&gt;二、数据资源对比&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元的数据优势&quot;&gt;腾讯混元的数据优势&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;训练数据规模&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;预训练数据从1万亿升级到&lt;strong&gt;7万亿tokens&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;使用超过100万条SFT(监督微调)数据,覆盖数学、代码、逻辑、文本创作等多个类别&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;生态数据资源&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;深度整合&lt;strong&gt;微信公众号&lt;/strong&gt;等生态资源&lt;/li&gt;
  &lt;li&gt;腾讯元宝支持一键接入微信客服、QQ机器人&lt;/li&gt;
  &lt;li&gt;可利用腾讯大数据平台的分析能力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;数据策略&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;对质量不一致的公开网络数据,采用合成方法进行转换和增强&lt;/li&gt;
  &lt;li&gt;构建多样化、高质量的合成数据&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;数据隐私&lt;/strong&gt;: 搜索结果未明确披露是否使用微信/QQ用户私人对话数据进行训练,主要强调整合公开生态资源(如公众号内容)&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰的数据策略&quot;&gt;阶跃星辰的数据策略&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;合成数据能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;强调通过&lt;strong&gt;生成式数据引擎&lt;/strong&gt;消除对传统手动数据收集的依赖&lt;/li&gt;
  &lt;li&gt;使用Step-2 LLM生成语言学多样且语义丰富的文本内容&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;多模态训练数据&lt;/strong&gt;(以Step-Audio为例):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;音频&lt;/strong&gt;: 1.1万亿音频tokens(约73万小时)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;TTS合成语音&lt;/strong&gt;: 1.13万亿tokens(约7万小时)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;ASR数据&lt;/strong&gt;: 1.05万亿tokens(约6.5万小时)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;音频-文本交替数据&lt;/strong&gt;: 3.5万亿tokens(约20万小时)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;文本数据&lt;/strong&gt;: 8000亿tokens&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;图像数据&lt;/strong&gt;: 8000亿图像-文本配对tokens&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;数据清洗策略&lt;/strong&gt;: Step 3多模语料引入相似度过滤、重采样与任务比例控制,提升图文协同质量&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;: 没有腾讯那样的大规模内部生态数据,更依赖公开数据和合成数据生成技术&lt;/p&gt;

&lt;h2 id=&quot;三开源策略与社区活跃度&quot;&gt;三、开源策略与社区活跃度&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元全系模型开源&quot;&gt;腾讯混元:全系模型开源&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;开源战略&lt;/strong&gt;: “坚定拥抱开源”,持续推进多尺寸、多场景的全系模型开源&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;主要开源模型&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型系列&lt;/th&gt;
      &lt;th&gt;参数规模&lt;/th&gt;
      &lt;th&gt;特性&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;混元-Large&lt;/td&gt;
      &lt;td&gt;3890亿参数MoE,520亿激活&lt;/td&gt;
      &lt;td&gt;当时业界最大开源MoE模型&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;混元2.0&lt;/td&gt;
      &lt;td&gt;406B总参数,32B激活&lt;/td&gt;
      &lt;td&gt;支持256K超长上下文&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Hunyuan-A13B&lt;/td&gt;
      &lt;td&gt;80B总参数,13B激活&lt;/td&gt;
      &lt;td&gt;首款13B级MoE开源混合推理模型&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;小尺寸模型&lt;/td&gt;
      &lt;td&gt;0.5B/1.8B/4B/7B&lt;/td&gt;
      &lt;td&gt;支持端侧部署,适配消费级芯片&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;混元3D世界模型1.0&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;业界首个可沉浸漫游、可交互、可仿真的开源世界生成模型&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;社区反响&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;混元-A13B开源仅3天拿下Hugging Face模型趋势榜&lt;strong&gt;第二名&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;混元3D系列模型社区下载量超过&lt;strong&gt;230万&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;图像、视频衍生模型数量分别达到&lt;strong&gt;1400和1600个&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;开放生态&lt;/strong&gt;: 模型已在Github、HuggingFace、魔搭社区等平台上线,Arm、高通、Intel、联发科技等芯片厂商支持部署&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰激进开源策略&quot;&gt;阶跃星辰:激进开源策略&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;开源理念&lt;/strong&gt;: 以开源为核心战略,快速建立技术影响力&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;重磅开源模型&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型系列&lt;/th&gt;
      &lt;th&gt;参数规模&lt;/th&gt;
      &lt;th&gt;特性&lt;/th&gt;
      &lt;th&gt;发布时间&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;Step 3&lt;/td&gt;
      &lt;td&gt;321B总参数,38B激活&lt;/td&gt;
      &lt;td&gt;最新一代基础大模型,强大视觉感知和复杂推理&lt;/td&gt;
      &lt;td&gt;2025年7月31日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step-Video-T2V&lt;/td&gt;
      &lt;td&gt;300亿参数&lt;/td&gt;
      &lt;td&gt;全球参数量最大的开源视频生成模型&lt;/td&gt;
      &lt;td&gt;2025年2月18日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step-Audio&lt;/td&gt;
      &lt;td&gt;千亿参数&lt;/td&gt;
      &lt;td&gt;业界首款产品级开源实时语音对话系统&lt;/td&gt;
      &lt;td&gt;2025年2月18日&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step-Video-TI2V&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;图生视频模型,运动可控&lt;/td&gt;
      &lt;td&gt;2025年&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;Step R-mini&lt;/td&gt;
      &lt;td&gt;-&lt;/td&gt;
      &lt;td&gt;Step系列首款推理模型&lt;/td&gt;
      &lt;td&gt;2025年1月&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;社区表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;开源第一日,GitHub上的Step-Audio和Step-Video-T2V两个仓库双双接近&lt;strong&gt;1000星&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;模型在HuggingFace、ModelScope、魔乐社区等多平台同步发布&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;合作生态&lt;/strong&gt;: 与吉利汽车集团联合开源,获得火山引擎、阿里云、华为昇腾等平台支持&lt;/p&gt;

&lt;h3 id=&quot;对比总结&quot;&gt;对比总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;开源力度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;全系开源(语言、视觉、3D等)&lt;/td&gt;
      &lt;td&gt;重点模型开源(Step 3、视频、音频)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;参数规模&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;最大3890B(混元-Large)&lt;/td&gt;
      &lt;td&gt;最大321B(Step 3)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;社区活跃度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;HF排名第2,下载量230万+&lt;/td&gt;
      &lt;td&gt;开源首日接近1000星&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;特色方向&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;端侧小模型+3D世界模型&lt;/td&gt;
      &lt;td&gt;视频生成+实时语音&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;战略意图&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;建立开源生态,支撑业务落地&lt;/td&gt;
      &lt;td&gt;快速建立技术影响力,吸引合作&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;h2 id=&quot;四agent与长上下文能力对比&quot;&gt;四、Agent与长上下文能力对比&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元业务驱动的agent布局&quot;&gt;腾讯混元:业务驱动的Agent布局&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;长上下文能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;预训练模型支持&lt;strong&gt;256K上下文&lt;/strong&gt;(约50万字)&lt;/li&gt;
  &lt;li&gt;指令模型支持&lt;strong&gt;128K长序列&lt;/strong&gt;处理&lt;/li&gt;
  &lt;li&gt;可一次性处理整本书籍或完整代码库,法律文档分析、代码审计效率提升&lt;strong&gt;300%&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Agent平台能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;推出&lt;strong&gt;腾讯元器&lt;/strong&gt;智能体开发平台&lt;/li&gt;
  &lt;li&gt;提供高级RAG(检索增强生成)能力、工作流能力、多智能体协作机制&lt;/li&gt;
  &lt;li&gt;支持企业级部署场景&lt;/li&gt;
  &lt;li&gt;混元-A13B擅长&lt;strong&gt;Agent工具调用&lt;/strong&gt;和长文理解,是腾讯内部调用量最大的大语言模型之一,超过&lt;strong&gt;400+业务&lt;/strong&gt;精调或直接调用,日均请求超&lt;strong&gt;1.3亿&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;RAG技术&lt;/strong&gt;: 腾讯强调RAG技术对企业AI应用的变革意义,特别是在法律、医疗、金融等专业领域减少AI幻觉&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;技术预判&lt;/strong&gt;(2024-2025):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ &lt;strong&gt;准确&lt;/strong&gt;: 预测RAG技术、长上下文、Agent平台将成为重点,2025年确实推出元器平台&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;务实&lt;/strong&gt;: 强调”从落地可用到智能协同”,聚焦业务价值&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;符合趋势&lt;/strong&gt;: IDC预测到2026年50%的中国500强数据团队将使用AI Agent&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;阶跃星辰押注智能终端agent&quot;&gt;阶跃星辰:押注智能终端Agent&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;长上下文能力&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;Step-1V支持&lt;strong&gt;128K上下文&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;Step 3采用5B Vision Encoder,通过双层2D卷积降采样,将视觉token数量减少至&lt;strong&gt;1/16&lt;/strong&gt;,减轻上下文压力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;Agent技术路线&lt;/strong&gt;:&lt;/p&gt;

&lt;p&gt;姜大昕明确提出:&lt;strong&gt;2025年是Agent元年&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Agent能力的两大基石&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;多模态能力&lt;/strong&gt;: 让Agent全面感知和理解世界&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;推理能力&lt;/strong&gt;(慢思考): 进行长链推理、主动规划、尝试、反思和纠错&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;Agent五层级发展路径&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;Level 1: 完成简单任务&lt;/li&gt;
  &lt;li&gt;Level 5: 情商阶段(高级智能)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;战略聚焦&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;将&lt;strong&gt;智能终端Agent&lt;/strong&gt;视为大模型技术落地的核心突破点&lt;/li&gt;
  &lt;li&gt;重点布局&lt;strong&gt;四大终端&lt;/strong&gt;: 汽车、手机、具身智能(机器人)、IoT&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;汽车&lt;/strong&gt;被视为”最关键的Agent落地场景”&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;合作案例&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;与吉利合作开发下一代智能座舱Agent OS&lt;/li&gt;
  &lt;li&gt;与OPPO合作布局手机场景&lt;/li&gt;
  &lt;li&gt;与智元机器人合作具身智能&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;技术预判&lt;/strong&gt;(2024-2025):&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ &lt;strong&gt;非常准确&lt;/strong&gt;: 姜大昕在2024年准确预判2025年Agent爆发,两大必要条件(多模态+推理)确实在2024年突破&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;前瞻性强&lt;/strong&gt;: 提前布局多模态能力,2年发布16款多模态模型,为Agent时代做好准备&lt;/li&gt;
  &lt;li&gt;✅ &lt;strong&gt;战略清晰&lt;/strong&gt;: 明确聚焦智能终端四大场景,而非泛泛而谈&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;对比总结-1&quot;&gt;对比总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;长上下文&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;256K(预训练),128K(指令)&lt;/td&gt;
      &lt;td&gt;128K&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;Agent策略&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;企业级平台+内部业务整合&lt;/td&gt;
      &lt;td&gt;智能终端Agent(车、手机、机器人、IoT)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;应用场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;400+内部业务,腾讯生态&lt;/td&gt;
      &lt;td&gt;外部合作(吉利、OPPO、智元)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术路线&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;RAG+长上下文+工具调用&lt;/td&gt;
      &lt;td&gt;多模态+推理能力+端侧部署&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术预判&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;务实准确,强调业务落地&lt;/td&gt;
      &lt;td&gt;前瞻准确,押注智能终端&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;日均调用&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;1.3亿+(混元-A13B)&lt;/td&gt;
      &lt;td&gt;未公开&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心差异&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: “横向整合”,利用生态优势在内部大规模落地,强调企业级能力&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: “垂直突破”,聚焦智能终端场景,通过合作伙伴生态实现商业化&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;五端侧部署能力对比&quot;&gt;五、端侧部署能力对比&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元全栈端侧方案&quot;&gt;腾讯混元:全栈端侧方案&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;小尺寸模型矩阵&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;模型规模&lt;/th&gt;
      &lt;th&gt;特性&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;0.5B&lt;/td&gt;
      &lt;td&gt;消费级显卡可运行&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;1.8B&lt;/td&gt;
      &lt;td&gt;适用于笔记本电脑&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;4B&lt;/td&gt;
      &lt;td&gt;支持手机、智能座舱&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;7B&lt;/td&gt;
      &lt;td&gt;智能家居等低功耗场景&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;技术特性&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;融合推理模型&lt;/strong&gt;: 支持快思考和慢思考两种模式
    &lt;ul&gt;
      &lt;li&gt;&lt;strong&gt;快思考&lt;/strong&gt;: 简洁、高效输出&lt;/li&gt;
      &lt;li&gt;&lt;strong&gt;慢思考&lt;/strong&gt;: 全面推理步骤,解决复杂问题&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;低成本微调&lt;/strong&gt;: 支持垂直领域定制化&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;落地案例&lt;/strong&gt;:&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;应用&lt;/th&gt;
      &lt;th&gt;场景&lt;/th&gt;
      &lt;th&gt;效果&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;腾讯手机管家&lt;/td&gt;
      &lt;td&gt;垃圾短信识别&lt;/td&gt;
      &lt;td&gt;毫秒级拦截,隐私零上传&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;腾讯智能座舱助手&lt;/td&gt;
      &lt;td&gt;车载环境&lt;/td&gt;
      &lt;td&gt;低功耗、高效推理&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;搜狗输入法&lt;/td&gt;
      &lt;td&gt;语音识别&lt;/td&gt;
      &lt;td&gt;嘈杂环境准确率提升&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;腾讯地图&lt;/td&gt;
      &lt;td&gt;多模型架构&lt;/td&gt;
      &lt;td&gt;意图分类和推理能力提升&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;微信输入法&lt;/td&gt;
      &lt;td&gt;“问AI”功能&lt;/td&gt;
      &lt;td&gt;输入框与AI无缝衔接&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;芯片支持&lt;/strong&gt;: Arm、高通、Intel、联发科技等消费级终端芯片平台全面支持&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰合作伙伴生态&quot;&gt;阶跃星辰:合作伙伴生态&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;部署策略&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;主要通过&lt;strong&gt;合作伙伴&lt;/strong&gt;实现端侧部署&lt;/li&gt;
  &lt;li&gt;与吉利通过DeepSeek-R1模型对”汽车主动交互端侧大模型”进行蒸馏训练&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;部署平台&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;火山引擎机器学习平台&lt;/li&gt;
  &lt;li&gt;魔乐社区、魔搭社区、HuggingFace&lt;/li&gt;
  &lt;li&gt;阿里云、火山引擎、TCL等企业接入&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;存储平台&lt;/strong&gt;: 使用JuiceFS构建存储平台,覆盖模型训练、推理部署等核心场景,支持模型高效跨云分发与快速加载&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;: 未见独立推出小型端侧模型系列(如0.5B-7B规模),主要依赖合作伙伴进行端侧适配&lt;/p&gt;

&lt;h3 id=&quot;对比总结-2&quot;&gt;对比总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;端侧模型&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;完整系列(0.5B-7B)&lt;/td&gt;
      &lt;td&gt;未独立推出,依赖合作&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;部署场景&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;手机、座舱、IoT全覆盖&lt;/td&gt;
      &lt;td&gt;主要是汽车场景(与吉利合作)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;芯片支持&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;Arm/高通/Intel/联发科全支持&lt;/td&gt;
      &lt;td&gt;依赖合作伙伴芯片适配&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;落地案例&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;内部生态(手机管家、输入法等)&lt;/td&gt;
      &lt;td&gt;外部合作(吉利、OPPO)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术优势&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;自主可控,深度优化&lt;/td&gt;
      &lt;td&gt;依赖模型蒸馏和合作伙伴&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;: 腾讯在端侧部署能力上具有&lt;strong&gt;显著优势&lt;/strong&gt;,拥有完整的模型矩阵、芯片支持和内部生态落地经验。阶跃星辰更依赖合作伙伴,端侧能力是其相对薄弱环节。&lt;/p&gt;

&lt;h2 id=&quot;六工程能力与生态整合&quot;&gt;六、工程能力与生态整合&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元生态整合能力&quot;&gt;腾讯混元:生态整合能力&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;内部生态规模&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;深度整合&lt;strong&gt;微信、QQ、腾讯元宝、腾讯会议、腾讯文档&lt;/strong&gt;等核心产品&lt;/li&gt;
  &lt;li&gt;超过&lt;strong&gt;600+业务线&lt;/strong&gt;接入混元能力&lt;/li&gt;
  &lt;li&gt;混元-A13B日均请求超&lt;strong&gt;1.3亿次&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;基础设施&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;腾讯云提供强大算力支撑&lt;/li&gt;
  &lt;li&gt;完整的工程化体系&lt;/li&gt;
  &lt;li&gt;企业级部署和运维能力&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;工程优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;规模化验证&lt;/strong&gt;: 在海量业务场景中验证模型能力&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;快速迭代&lt;/strong&gt;: 基于真实反馈持续优化&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;成本控制&lt;/strong&gt;: 自有算力和优化经验降低成本&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;阶跃星辰技术突破能力&quot;&gt;阶跃星辰:技术突破能力&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;技术迭代速度&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;成立2年发布&lt;strong&gt;16款多模态模型&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;2024年发布&lt;strong&gt;11款模型&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;技术创新速度极快&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;合作生态&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;汽车&lt;/strong&gt;: 吉利汽车集团(智能座舱)&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;手机&lt;/strong&gt;: OPPO&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;机器人&lt;/strong&gt;: 智元机器人&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;云平台&lt;/strong&gt;: 火山引擎、阿里云、华为昇腾&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;工程平台&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;JuiceFS存储平台支持模型训练、推理部署&lt;/li&gt;
  &lt;li&gt;支持高效跨云分发与快速加载&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;劣势&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;缺乏自有大规模应用场景验证&lt;/li&gt;
  &lt;li&gt;依赖外部合作伙伴进行商业化落地&lt;/li&gt;
  &lt;li&gt;工程化经验积累不如腾讯&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;对比总结-3&quot;&gt;对比总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;生态整合&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;600+内部业务&lt;/td&gt;
      &lt;td&gt;外部合作伙伴生态&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;规模验证&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;日均1.3亿+请求&lt;/td&gt;
      &lt;td&gt;依赖合作伙伴应用&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;基础设施&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;腾讯云自有算力&lt;/td&gt;
      &lt;td&gt;依赖第三方云平台&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;技术迭代&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;稳健,业务驱动&lt;/td&gt;
      &lt;td&gt;极快,2年16款模型&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;工程经验&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;大规模系统经验丰富&lt;/td&gt;
      &lt;td&gt;创业公司,相对有限&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;商业化&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;内部变现+对外API&lt;/td&gt;
      &lt;td&gt;合作伙伴生态&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;结论&lt;/strong&gt;: 腾讯在&lt;strong&gt;工程能力和生态整合&lt;/strong&gt;上具有压倒性优势,这是大公司的护城河。阶跃星辰在&lt;strong&gt;技术创新速度&lt;/strong&gt;上更激进,但商业化依赖外部合作,工程化能力需要时间积累。&lt;/p&gt;

&lt;h2 id=&quot;七技术预判的准确性分析&quot;&gt;七、技术预判的准确性分析&lt;/h2&gt;

&lt;h3 id=&quot;腾讯混元务实派&quot;&gt;腾讯混元:务实派&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;2024年的预测&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;长上下文将成为核心能力 ✅&lt;/li&gt;
  &lt;li&gt;RAG技术将变革企业AI应用 ✅&lt;/li&gt;
  &lt;li&gt;Agent平台将成为重点 ✅&lt;/li&gt;
  &lt;li&gt;多模态能力将深度融合 ✅&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;2025年实际表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ 推出256K长上下文能力&lt;/li&gt;
  &lt;li&gt;✅ 发布腾讯元器Agent开发平台&lt;/li&gt;
  &lt;li&gt;✅ 混元Turbo S进入全球前八(Chatbot Arena)&lt;/li&gt;
  &lt;li&gt;✅ 3D世界模型开源&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;预判特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;务实准确&lt;/strong&gt;: 预测基于业务需求,而非技术热点&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;聚焦落地&lt;/strong&gt;: 强调”从落地可用到智能协同”&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;符合趋势&lt;/strong&gt;: 预测与行业主流趋势一致&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;阶跃星辰前瞻派&quot;&gt;阶跃星辰:前瞻派&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;姜大昕2024年的预测&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;2025年是Agent元年&lt;/strong&gt; ✅&lt;/li&gt;
  &lt;li&gt;Agent爆发需要两大条件:&lt;strong&gt;多模态能力+推理能力&lt;/strong&gt; ✅&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;智能终端&lt;/strong&gt;(汽车、手机、机器人)是最重要的Agent落地场景 ✅&lt;/li&gt;
  &lt;li&gt;汽车是”最关键的Agent落地场景” ✅(业界共识正在形成)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;2025年实际表现&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;✅ Agent概念确实在2025年爆发,成为行业最热话题&lt;/li&gt;
  &lt;li&gt;✅ 多模态和推理能力在2024年突破,为Agent铺路(DeepSeek-R1等推理模型爆发)&lt;/li&gt;
  &lt;li&gt;✅ 与吉利、OPPO等合作,抢占智能终端Agent赛道&lt;/li&gt;
  &lt;li&gt;✅ 推出Step R-mini推理模型和Step 3多模态模型,技术路线与预判完全吻合&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;预判特点&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;非常准确&lt;/strong&gt;: 提前1年准确预判Agent爆发时间点和必要条件&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;前瞻性强&lt;/strong&gt;: 在行业普遍关注纯文本对话时,坚定布局多模态&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;战略清晰&lt;/strong&gt;: 明确聚焦智能终端四大场景,而非跟风炒作&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;对比总结-4&quot;&gt;对比总结&lt;/h3&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;维度&lt;/th&gt;
      &lt;th&gt;腾讯混元&lt;/th&gt;
      &lt;th&gt;阶跃星辰&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;预判风格&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;务实、业务导向&lt;/td&gt;
      &lt;td&gt;前瞻、趋势洞察&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;准确度&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;高(基于内部需求)&lt;/td&gt;
      &lt;td&gt;非常高(提前1年判断)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;落地能力&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;强(生态支撑)&lt;/td&gt;
      &lt;td&gt;中(依赖合作)&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;风险偏好&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;稳健,渐进式创新&lt;/td&gt;
      &lt;td&gt;激进,押注未来场景&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;&lt;strong&gt;代表预判&lt;/strong&gt;&lt;/td&gt;
      &lt;td&gt;“RAG技术变革企业AI”&lt;/td&gt;
      &lt;td&gt;“2025年是Agent元年”&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;&lt;strong&gt;核心洞察&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: 预判基于内部业务需求,落地能力强,但不一定领先行业趋势&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: 预判基于技术趋势和场景洞察,前瞻性强,但落地依赖合作伙伴&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;八总结两种路径各有千秋&quot;&gt;八、总结:两种路径,各有千秋&lt;/h2&gt;

&lt;h3 id=&quot;腾讯元宝混元巨头整合路径&quot;&gt;腾讯元宝/混元:巨头整合路径&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;核心优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;数据资源&lt;/strong&gt;: 7万亿tokens训练数据+腾讯生态数据&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;工程能力&lt;/strong&gt;: 600+业务验证,日均1.3亿+请求&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;端侧部署&lt;/strong&gt;: 完整0.5B-7B模型矩阵,全芯片平台支持&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;生态整合&lt;/strong&gt;: 微信、QQ等亿级用户产品深度整合&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;技术路线&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;横向整合&lt;/strong&gt;,利用生态优势大规模落地&lt;/li&gt;
  &lt;li&gt;强调企业级能力和业务价值&lt;/li&gt;
  &lt;li&gt;开源+闭源并行,支撑商业化&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;适合场景&lt;/strong&gt;: 企业服务、消费者应用、生态内业务&lt;/p&gt;

&lt;h3 id=&quot;阶跃星辰创业突破路径&quot;&gt;阶跃星辰:创业突破路径&lt;/h3&gt;

&lt;p&gt;&lt;strong&gt;核心优势&lt;/strong&gt;:&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;技术迭代&lt;/strong&gt;: 2年16款模型,创新速度极快&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;前瞻预判&lt;/strong&gt;: 准确预判2025年Agent爆发&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;多模态&lt;/strong&gt;: 语音、视频、图像全栈能力&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;开源策略&lt;/strong&gt;: 激进开源,快速建立影响力&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;strong&gt;技术路线&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;垂直突破&lt;/strong&gt;,聚焦智能终端Agent(车、手机、机器人、IoT)&lt;/li&gt;
  &lt;li&gt;通过合作伙伴生态实现商业化&lt;/li&gt;
  &lt;li&gt;技术优先,快速迭代&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;适合场景&lt;/strong&gt;: 智能汽车、智能手机、具身智能等新兴场景&lt;/p&gt;

&lt;h3 id=&quot;谁更有未来&quot;&gt;谁更有未来?&lt;/h3&gt;

&lt;p&gt;这不是一个非此即彼的问题:&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;短期(1-2年)&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯混元&lt;/strong&gt;在工程落地、生态整合、端侧部署上具有&lt;strong&gt;显著优势&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;更适合企业服务和消费者应用市场&lt;/li&gt;
  &lt;li&gt;商业化路径更清晰&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;中长期(3-5年)&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;在智能终端Agent赛道上的&lt;strong&gt;前瞻布局&lt;/strong&gt;可能带来巨大回报&lt;/li&gt;
  &lt;li&gt;如果汽车、机器人等场景爆发,其技术路线将更加契合&lt;/li&gt;
  &lt;li&gt;但需要克服工程化能力不足和生态依赖的挑战&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;本质差异&lt;/strong&gt;:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;腾讯&lt;/strong&gt;: “我有生态,你来用我的能力”&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;阶跃星辰&lt;/strong&gt;: “我有技术,我们一起定义未来场景”&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;对于开发者和企业而言,选择哪家取决于:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;如果需要&lt;strong&gt;稳定的企业级服务、丰富的生态整合&lt;/strong&gt;,选腾讯混元&lt;/li&gt;
  &lt;li&gt;如果要&lt;strong&gt;探索智能终端新场景、快速技术迭代&lt;/strong&gt;,选阶跃星辰&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;最终,中国AI大模型市场足够大,可以容纳两种路径的成功。竞争的本质不是零和博弈,而是共同推动技术进步和场景落地。&lt;/p&gt;

&lt;hr /&gt;

&lt;h2 id=&quot;参考来源&quot;&gt;参考来源&lt;/h2&gt;

&lt;p&gt;Sources:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.mittrchina.com/news/detail/13376&quot;&gt;腾讯混元再升级，推出大模型App”腾讯元宝”&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/06/302762.html&quot;&gt;腾讯混元推出首款开源混合推理模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/08/318288.html&quot;&gt;手机也能跑大模型，腾讯混元推出多款小尺寸开源模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.sfccn.com/2025/2-22/1NMDE0NDlfMTk5Mzg1Ng.html&quot;&gt;阶跃星辰CEO姜大昕：进入Agent发展阶段，落地智能终端&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.ifanr.com/1615369&quot;&gt;最低调的「AI 六小龙」阶跃星辰，在 DeepSeek 浪潮中交出了一份新答卷&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://testerhome.com/topics/41597&quot;&gt;技术详解：阶跃星辰开源语音交互和视频生成模型&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.qbitai.com/2025/05/286237.html&quot;&gt;腾讯大模型战略首次全景亮相！智能体平台重磅上线&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.vzkoo.com/read/202506040e48408258434386d4edfa73.html&quot;&gt;2024年腾讯混元大模型深度分析&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</content>
 </entry>
 
 <entry>
   <title>6亿美元的昆虫梦碎：Ynsect破产案例深度解读</title>
   <link href="https://loredunk.github.io//blog/2026/01/13/ynsect-600m-failure-analysis/"/>
   <updated>2026-01-13T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2026/01/13/ynsect-600m-failure-analysis</id>
   <content type="html">&lt;p&gt;在创业世界里，有些失败案例的价值远超成功故事。今天要讲的 Ynsect 就是这样一个典型案例——一家曾融资超过 6 亿美元、被誉为”昆虫养殖行业独角兽”的法国公司，在 2025 年底黯然进入司法清算程序。这个故事不仅是关于一家公司的兴衰，更是对”过早规模化”这一创业死亡陷阱的深刻警示。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;从明星公司到破产清算&quot;&gt;从明星公司到破产清算&lt;/h2&gt;

&lt;p&gt;2021 年超级碗期间，好莱坞巨星小罗伯特·唐尼（Robert Downey Jr.）在公开场合为 Ynsect 站台，称赞其在可持续蛋白质生产方面的创新。那时的 Ynsect 风光无限：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;融资总额&lt;/strong&gt;：超过 6 亿美元，是昆虫养殖行业融资最多的公司&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;愿景&lt;/strong&gt;：通过工业化昆虫养殖生产高质量蛋白质，解决全球食品安全和可持续发展问题&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;明星项目&lt;/strong&gt;：Ÿnfarm——位于法国北部的”超级工厂”，被称为”世界上最昂贵的虫子农场”&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;然而，仅仅 4 年后，这家明星公司就走到了尽头。2025 年 12 月，Ynsect 正式进入司法清算程序，成为欧洲科技创业史上最引人注目的失败案例之一。&lt;/p&gt;

&lt;h2 id=&quot;致命错误在验证商业模式前就建造超级工厂&quot;&gt;致命错误：在验证商业模式前就建造超级工厂&lt;/h2&gt;

&lt;p&gt;Ynsect 的核心失误可以用一个词概括：&lt;strong&gt;过早规模化&lt;/strong&gt;（Premature Scaling）。&lt;/p&gt;

&lt;h3 id=&quot;数百万美元打了水漂&quot;&gt;数百万美元打了水漂&lt;/h3&gt;

&lt;p&gt;公司将数亿美元投入到 Ÿnfarm 超级工厂的建设中，但这笔巨额投资发生在一个关键节点&lt;strong&gt;之前&lt;/strong&gt;——公司尚未：&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;验证商业模式的可行性&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;搞清楚单位经济学&lt;/strong&gt;（Unit Economics）&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;证明能够盈利&lt;/strong&gt;&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;这就像一个餐厅老板在验证菜品是否受欢迎之前，就投资建造了 100 家连锁店。结果可想而知。&lt;/p&gt;

&lt;h3 id=&quot;残酷的数据&quot;&gt;残酷的数据&lt;/h3&gt;

&lt;p&gt;2023 年的财务数据揭示了问题的严重性：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;营收&lt;/strong&gt;：仅 65.6 万欧元（不包括内部交易）&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;亏损&lt;/strong&gt;：超过 8000 万欧元&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;亏损比&lt;/strong&gt;：营收与亏损比例约为 &lt;strong&gt;1:122&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;这意味着公司每赚 1 欧元，就要亏损 122 欧元。这样的单位经济学根本无法支撑大规模工厂的运营。&lt;/p&gt;

&lt;h2 id=&quot;市场现实-vs-美好愿景&quot;&gt;市场现实 vs. 美好愿景&lt;/h2&gt;

&lt;h3 id=&quot;动物饲料市场的残酷真相&quot;&gt;动物饲料市场的残酷真相&lt;/h3&gt;

&lt;p&gt;Ynsect 的主要产品是&lt;strong&gt;昆虫蛋白&lt;/strong&gt;，目标市场包括动物饲料和宠物食品。但公司忽视了一个基本事实：&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;动物饲料是一个由价格驱动的商品市场，而非可持续性溢价市场。&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;换句话说：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;养殖户和饲料生产商首先关注的是&lt;strong&gt;成本&lt;/strong&gt;，而非环保理念&lt;/li&gt;
  &lt;li&gt;昆虫蛋白必须在价格上与传统饲料（豆粕、鱼粉等）竞争，而非依靠”可持续”标签卖更高价格&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;昂贵的额外步骤&quot;&gt;昂贵的”额外步骤”&lt;/h3&gt;

&lt;p&gt;更糟糕的是，工业化昆虫养殖通常依赖&lt;strong&gt;谷物副产品&lt;/strong&gt;作为昆虫的饲料——而这些副产品本身就可以直接用作动物饲料。&lt;/p&gt;

&lt;p&gt;这意味着：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;昆虫蛋白生产只是在产业链中&lt;strong&gt;增加了一个昂贵的中间环节&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;最终产品的成本更高，而营养价值并未显著提升&lt;/li&gt;
  &lt;li&gt;在价格敏感的市场中，这种成本劣势是致命的&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;战略摇摆不定&quot;&gt;战略摇摆不定&lt;/h2&gt;

&lt;p&gt;Ynsect 还犯了另一个经典错误：&lt;strong&gt;战略模糊&lt;/strong&gt;。&lt;/p&gt;

&lt;p&gt;公司试图同时服务两个市场：&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;&lt;strong&gt;动物饲料市场&lt;/strong&gt;：低利润率、价格敏感、规模化需求&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;宠物食品市场&lt;/strong&gt;：相对高利润率、更关注品质和营养&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;这两个市场的经济学特征截然不同，需要完全不同的运营策略和成本结构。但 Ynsect 从未清晰选择主攻方向，导致：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;资源分散&lt;/li&gt;
  &lt;li&gt;无法在任何一个市场建立真正的竞争优势&lt;/li&gt;
  &lt;li&gt;并购策略同样缺乏聚焦&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;欧洲创业生态的深层问题&quot;&gt;欧洲创业生态的深层问题&lt;/h2&gt;

&lt;p&gt;Failory 的这篇案例分析还揭示了一个更深层的问题，一位分析师的评论一针见血：&lt;/p&gt;

&lt;blockquote&gt;
  &lt;p&gt;&lt;strong&gt;“Ynsect 是欧洲规模化鸿沟的典型案例。我们资助登月计划，却在工厂建设上投资不足；我们庆祝试点项目，却放弃工业化。”&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;这揭示了欧洲科技创业生态的一个结构性矛盾：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;前期&lt;/strong&gt;：愿意为宏大愿景提供大量资金&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;中期&lt;/strong&gt;：在需要持续资金支持工业化时，投资者信心不足&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;结果&lt;/strong&gt;：公司既没有在早期阶段充分验证，也没有在扩张阶段获得足够支持&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;给创业者的启示&quot;&gt;给创业者的启示&lt;/h2&gt;

&lt;p&gt;Ynsect 的失败为所有创业者提供了宝贵教训：&lt;/p&gt;

&lt;h3 id=&quot;1-先验证再规模化&quot;&gt;1. &lt;strong&gt;先验证，再规模化&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;无论愿景多么宏大、融资多么容易，都必须先在小规模上证明：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;产品市场契合度（Product-Market Fit）&lt;/li&gt;
  &lt;li&gt;单位经济学的可持续性&lt;/li&gt;
  &lt;li&gt;盈利的可能性&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;只有当这些基本要素得到验证，规模化才不是一场赌博。&lt;/p&gt;

&lt;h3 id=&quot;2-理解你的市场本质&quot;&gt;2. &lt;strong&gt;理解你的市场本质&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;B2B 商品市场与消费品市场有本质区别：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;商品市场几乎总是由价格驱动&lt;/li&gt;
  &lt;li&gt;“可持续”、”环保”等概念在采购决策中的权重远低于创始人的期望&lt;/li&gt;
  &lt;li&gt;如果无法在成本上竞争，再好的故事也卖不出去&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;3-战略聚焦的重要性&quot;&gt;3. &lt;strong&gt;战略聚焦的重要性&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;不要试图同时服务经济学特征完全不同的市场。选择一个方向，深入理解这个市场的游戏规则，建立真正的竞争优势。&lt;/p&gt;

&lt;h3 id=&quot;4-警惕技术驱动陷阱&quot;&gt;4. &lt;strong&gt;警惕”技术驱动”陷阱&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;很多硬科技创业公司容易陷入”技术本位主义”——认为技术先进就能成功。但现实是：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;技术优势必须转化为成本优势或显著的客户价值&lt;/li&gt;
  &lt;li&gt;市场不会为”很酷但很贵”的技术买单&lt;/li&gt;
  &lt;li&gt;商业模式的重要性不亚于技术本身&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;5-融资多成功概率高&quot;&gt;5. &lt;strong&gt;融资多≠成功概率高&lt;/strong&gt;&lt;/h3&gt;

&lt;p&gt;6 亿美元的融资在很多人看来是成功的标志，但它也可能成为陷阱：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;大量资金让公司过早承诺规模化&lt;/li&gt;
  &lt;li&gt;投资者的高期望推动激进扩张&lt;/li&gt;
  &lt;li&gt;失去了小步试错、灵活调整的机会&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;结语&quot;&gt;结语&lt;/h2&gt;

&lt;p&gt;Ynsect 的故事令人唏嘘，但其失败的价值不可估量。它提醒我们：&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;在商业世界里，宏大的愿景、明星的背书、巨额的融资，都不能替代一个经过验证的、可持续的商业模式。&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;对于每一个怀抱梦想的创业者来说，Ynsect 的 6 亿美元教训值得铭记：先用最小的成本证明你的商业模式，再用资本去放大它。否则，融资越多，跌得可能越惨。&lt;/p&gt;

&lt;hr /&gt;

&lt;h2 id=&quot;参考来源&quot;&gt;参考来源&lt;/h2&gt;

&lt;p&gt;本文基于 Failory 网站发布的案例研究以及相关报道整理而成。&lt;/p&gt;

&lt;p&gt;Sources:&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.failory.com&quot;&gt;Failory: 90% of Startups Fail — Learn How Not To.&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;
    &lt;table&gt;
      &lt;tbody&gt;
        &lt;tr&gt;
          &lt;td&gt;[How reality crushed Ÿnsect, the French startup that had raised over $600M for insect farming&lt;/td&gt;
          &lt;td&gt;TechCrunch](https://techcrunch.com/2025/12/26/how-reality-crushed-ynsect-the-french-startup-that-had-raised-over-600m-for-insect-farming/)&lt;/td&gt;
        &lt;/tr&gt;
      &lt;/tbody&gt;
    &lt;/table&gt;
  &lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://cbg.com.cy/ynsects-fall-how-market-realities-derailed-a-600m-french-insect-farming-startup/&quot;&gt;Ÿnsect’s Fall: How Market Realities Derailed a $600M French Insect-Farming Startup&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://uttkrist.com/ynsect-insect-farming-bankruptcy-exposes-a-600m-scaling-failure/&quot;&gt;Ÿnsect Insect Farming Bankruptcy Exposes a $600M Scaling Failure&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</content>
 </entry>
 
 <entry>
   <title>构建有效的 AI Agent：来自 Anthropic 的实践经验</title>
   <link href="https://loredunk.github.io//blog/2026/01/05/Building-Effective-Agents/"/>
   <updated>2026-01-05T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2026/01/05/Building-Effective-Agents</id>
   <content type="html">&lt;p&gt;在过去的一年里，Anthropic 与数十个团队合作，帮助他们在各个行业中构建基于 LLM 的 Agent 系统。令人惊讶的是，最成功的实现并非使用复杂的框架或专用库，而是采用简单、可组合的模式。本文总结了 Anthropic 在 2024 年 12 月发布的《Building Effective Agents》中分享的核心经验和最佳实践。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;核心理念简单优先&quot;&gt;核心理念：简单优先&lt;/h2&gt;

&lt;p&gt;Anthropic 的首要建议是：&lt;strong&gt;找到最简单的解决方案&lt;/strong&gt;，只在必要时增加复杂性。这可能意味着根本不需要构建 Agent 系统。许多问题通过简单的提示工程或传统的软件工程就能很好地解决。&lt;/p&gt;

&lt;h2 id=&quot;workflow-vs-agent关键区别&quot;&gt;Workflow vs Agent：关键区别&lt;/h2&gt;

&lt;p&gt;Anthropic 对 Agentic 系统做了重要的架构区分：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;Workflow（工作流）&lt;/strong&gt;：通过预定义的代码路径来编排 LLM 和工具&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;Agent（智能体）&lt;/strong&gt;：LLM 动态地指导自己的流程和工具使用&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;理解这个区别对于选择合适的架构至关重要。&lt;/p&gt;

&lt;h2 id=&quot;基础构建块增强型-llm&quot;&gt;基础构建块：增强型 LLM&lt;/h2&gt;

&lt;p&gt;所有 Agentic 系统的核心是 &lt;strong&gt;Augmented LLM&lt;/strong&gt;（增强型 LLM），它具备以下能力：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;生成自己的搜索查询&lt;/li&gt;
  &lt;li&gt;选择相关工具&lt;/li&gt;
  &lt;li&gt;决定在记忆中存储什么信息&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;五种-workflow-模式&quot;&gt;五种 Workflow 模式&lt;/h2&gt;

&lt;h3 id=&quot;1-prompt-chaining提示链&quot;&gt;1. Prompt Chaining（提示链）&lt;/h3&gt;
&lt;p&gt;将任务分解为一系列步骤，每个 LLM 调用处理前一个的输出。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;适用场景&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;需要将复杂任务拆分为清晰、连续的步骤&lt;/li&gt;
  &lt;li&gt;每个步骤的输出是下一步的输入&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;优势&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;易于实现和调试&lt;/li&gt;
  &lt;li&gt;每个步骤可以优化特定任务&lt;/li&gt;
  &lt;li&gt;成本效益高（可以为简单步骤使用较小的模型）&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;2-routing路由&quot;&gt;2. Routing（路由）&lt;/h3&gt;
&lt;p&gt;根据输入分类，将其导向专门的后续任务。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;典型应用&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;将简单/常见问题路由到小模型（如 Claude 3.5 Haiku）&lt;/li&gt;
  &lt;li&gt;将复杂/罕见问题路由到更强大的模型（如 Claude 3.5 Sonnet）&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;优势&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;优化成本和延迟&lt;/li&gt;
  &lt;li&gt;根据任务复杂度分配计算资源&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;3-parallelization并行化&quot;&gt;3. Parallelization（并行化）&lt;/h3&gt;
&lt;p&gt;将任务分解为独立的子任务并行运行，或多次运行同一任务获得多样化输出。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;两种形式&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;strong&gt;Sectioning&lt;/strong&gt;：将任务分成独立部分并行处理&lt;/li&gt;
  &lt;li&gt;&lt;strong&gt;Voting&lt;/strong&gt;：多次运行相同任务，通过投票选择最佳输出&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;优势&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;显著减少总执行时间&lt;/li&gt;
  &lt;li&gt;提高输出质量和可靠性&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;4-orchestrator-workers编排者-工作者&quot;&gt;4. Orchestrator-Workers（编排者-工作者）&lt;/h3&gt;
&lt;p&gt;中央 LLM 动态分解任务，委托给工作 LLM，并综合结果。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;适用场景&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;任务无法提前分解的复杂问题&lt;/li&gt;
  &lt;li&gt;需要动态规划和协调的场景&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;特点&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;更灵活但也更复杂&lt;/li&gt;
  &lt;li&gt;需要精心设计编排逻辑&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;5-evaluator-optimizer评估者-优化器&quot;&gt;5. Evaluator-Optimizer（评估者-优化器）&lt;/h3&gt;
&lt;p&gt;通过 LLM 评估和优化输出，进行迭代改进。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;最有效的场景&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;有明确的评估标准&lt;/li&gt;
  &lt;li&gt;迭代改进能带来可衡量的价值&lt;/li&gt;
  &lt;li&gt;LLM 能够提供有用的反馈&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;应用&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;代码生成和优化&lt;/li&gt;
  &lt;li&gt;内容创作和编辑&lt;/li&gt;
  &lt;li&gt;复杂问题求解&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;实践建议&quot;&gt;实践建议&lt;/h2&gt;

&lt;h3 id=&quot;1-从简单开始&quot;&gt;1. 从简单开始&lt;/h3&gt;
&lt;p&gt;直接使用 LLM API 开始，许多模式只需几行代码就能实现。框架往往会创建额外的抽象层，使底层提示和响应难以调试。&lt;/p&gt;

&lt;h3 id=&quot;2-避免过早优化&quot;&gt;2. 避免过早优化&lt;/h3&gt;
&lt;p&gt;不要因为框架提供了复杂功能就使用它们。先用简单的设置验证想法，再根据需要增加复杂性。&lt;/p&gt;

&lt;h3 id=&quot;3-可观测性优先&quot;&gt;3. 可观测性优先&lt;/h3&gt;
&lt;p&gt;确保能够：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;查看每一步的提示和响应&lt;/li&gt;
  &lt;li&gt;追踪决策过程&lt;/li&gt;
  &lt;li&gt;快速定位问题&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;4-选择合适的模式&quot;&gt;4. 选择合适的模式&lt;/h3&gt;
&lt;p&gt;根据任务特点选择：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;步骤明确 → Prompt Chaining&lt;/li&gt;
  &lt;li&gt;需要分类 → Routing&lt;/li&gt;
  &lt;li&gt;可并行化 → Parallelization&lt;/li&gt;
  &lt;li&gt;动态复杂 → Orchestrator-Workers&lt;/li&gt;
  &lt;li&gt;需要迭代 → Evaluator-Optimizer&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;agent-模式何时使用真正的-agent&quot;&gt;Agent 模式：何时使用真正的 Agent&lt;/h2&gt;

&lt;p&gt;当 Workflow 无法满足需求时，才考虑构建真正的 Agent 系统。Agent 的核心特征是 LLM 能够：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;自主决定下一步行动&lt;/li&gt;
  &lt;li&gt;动态选择和使用工具&lt;/li&gt;
  &lt;li&gt;根据反馈调整策略&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;strong&gt;适用场景&lt;/strong&gt;：&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;任务路径高度不确定&lt;/li&gt;
  &lt;li&gt;需要在复杂环境中做出实时决策&lt;/li&gt;
  &lt;li&gt;必须处理意外情况和异常&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;结语&quot;&gt;结语&lt;/h2&gt;

&lt;p&gt;Anthropic 的实践经验告诉我们，构建有效的 AI Agent 不是关于使用最新、最复杂的技术，而是：&lt;/p&gt;
&lt;ol&gt;
  &lt;li&gt;理解问题的本质&lt;/li&gt;
  &lt;li&gt;选择合适的抽象层级&lt;/li&gt;
  &lt;li&gt;从简单开始，按需增加复杂性&lt;/li&gt;
  &lt;li&gt;保持系统的可观测性和可调试性&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;这些原则不仅适用于 Agent 系统，也是所有软件工程的最佳实践。&lt;/p&gt;

&lt;hr /&gt;

&lt;p&gt;&lt;strong&gt;参考资料：&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.anthropic.com/research/building-effective-agents&quot;&gt;Building Effective AI Agents - Anthropic&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://github.com/anthropics/anthropic-cookbook/tree/main/patterns/agents&quot;&gt;Anthropic Cookbook - Agent Patterns&lt;/a&gt;&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;https://www.anthropic.com/news/building-effective-agents&quot;&gt;Building Effective Agents - News&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</content>
 </entry>
 
 <entry>
   <title>算法工程师的困境</title>
   <link href="https://loredunk.github.io//blog/2024/10/27/%E5%B0%9D%E8%AF%95%E6%88%90%E4%B8%BA%E4%B8%80%E4%B8%AA%E7%8B%AC%E7%AB%8B%E5%BC%80%E5%8F%91/"/>
   <updated>2024-10-27T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2024/10/27/尝试成为一个独立开发</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
    算法工程师正在面临尴尬的困境，也许会AI框架或者agent或者能做跨平台demo的，才是一个好的选择，除了优化推理流程，部署（算子转换），普通的算法工程师能做的工作，比如之前的nlp工程师做的工作要不然就是转移到其他领域，要不然就有被替代，或者成为推荐算法工程师，CV算法工程师？虽然之前的bert Nlp的也都是微调。其实我是想做产品的，但是没踏足过那个领域，我对自己还没有盲目自信到那程度，我希望能先直接进入这个开发流程，做一个demo，然后快速的验证我的想法。
&lt;/div&gt;

&lt;!--more--&gt;

&lt;p&gt;如果天天做自己并不感兴趣的产品，或者仅仅只是完成枯燥的工作，是找不到起床的理由的。动机对我来说即是推动我前进的动力，也是幸福的来源。&lt;/p&gt;

&lt;p&gt;我会因为这个兴奋的睡不着，但是也会幻想后面产品的成功的样子，当然如果发布了这个产品，到真正有第一个用户，我还有很多的事情需要完成。&lt;/p&gt;

&lt;p&gt;不过我希望这个能存在我blog，如果有坚持不下去的时候，在某个放弃的下午，看一看&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>多模态大模型</title>
   <link href="https://loredunk.github.io//blog/2024/10/21/%E5%A4%9A%E6%A8%A1%E6%80%81%E5%A4%A7%E6%A8%A1%E5%9E%8B/"/>
   <updated>2024-10-21T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2024/10/21/多模态大模型</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
    多模态大模型是一个讲录音，图片，文字结合在一起的模型，端到端的训练，可能图片采用的是clip，语音采用的是whisper，大模型这一段有各种各样的，但是万变不离其宗，但是我们想要搞懂，多模态大模型是如何训练的，是一个非常有意思的事情，包括多模态理论上是可以做什么的？或者说多模态大模型能力的边界是什么？我决定从下手，当然这是一个很好的一个example,篇幅并不是很大，并且母语为中文来写的英文论文，中国人比较看得懂（笑。其次最近也有一些其他的工作陆续推出，比如，之前omini1的端到端是没有图片的识别，现在也支持了更多的模态，并且一些图片模态的也开始陆续支持声音的这一向量。
&lt;/div&gt;
&lt;!--more--&gt;

&lt;p&gt;&lt;a href=&quot;https://arxiv.org/pdf/2409.12191&quot;&gt;Qwen2vl&lt;/a&gt;  &lt;a href=&quot;https://arxiv.org/pdf/2410.11190&quot;&gt;mini-omni2&lt;/a&gt;
    对于从Qwen2-vl，我想搞清楚三个问题：
    1. 多模态模型是怎么训练的
    2. 为什么图像能做OCR？token化图像，为什么不会被撕裂掉？
    3. 怎么做function call?
    4. 有没有更快的方法可以和大模型进行交互？（开放性问题）&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;
    &lt;p&gt;多模态模型是怎么训练的？&lt;/p&gt;

    &lt;p&gt;首先训练数据都用到了ChatML（openai）提出的，这个就是现在数据为什么都使用一个Chat template
一个是训练对话能力。
一个训练vedio grounding能力，也就是所谓的是视觉基础能力，里面训练数据会被插入被标准化到1到1000的数值，&lt;/p&gt;

    &lt;p&gt;我查看了去年比较早起的LLava工作，讲的是如何讲视觉信息融入大模型的语义，通过不断去学习vit投射到模型输入的同一语义空间中，
 语义上的对齐，并且制作了多种的语言模板，大概结构是图片+图片描述+针对图片上的问答，大概有100K左右的instruction following data。
 其次这种instrction的问答都是用当时的刚宣布自己支持图片模态的GPT4制造出来的数据。&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;然后出来了一个gpt40，拥有实时和人类对话的模型。&lt;/p&gt;

    &lt;p&gt;对于Mini-omni，我想搞清楚，他和视觉模型有没有一些工程上的不一样？&lt;/p&gt;

    &lt;p&gt;不过这个的数据，是通过gpt40制造出来的数据。&lt;/p&gt;
  &lt;/li&gt;
&lt;/ol&gt;
</content>
 </entry>
 
 <entry>
   <title>复利——初心</title>
   <link href="https://loredunk.github.io//blog/2024/10/20/%E9%87%91%E9%92%B1%E5%BF%83%E7%90%86%E5%AD%A6-%E5%A4%8D%E5%88%A9/"/>
   <updated>2024-10-20T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2024/10/20/金钱心理学——复利</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
复利不光指的是金钱上的复利，对任何事情不间断的投入，都能带来可观的收入。一个人是一个人习惯和生活方式的组成，你可以说一个人的命是这样的组成，也可以说一个人的健康问题是习惯的组成。复利如果在生活的语境中，就是习惯。
&lt;/div&gt;
&lt;!--more--&gt;

&lt;p&gt;人可能永远都没法预计自己几年之后是什么样，回过头来看，五年前，甚至三年前无法预料自己能够做算法岗，没法预料自己对投资理财开始深入，虽然的投资并不是特别理性的，主要目前本金不够多，对理财这件事并不是非常上行。生活的杂音很多，眼界也在不断的开阔，但是不忘初心（这个是你不断验证，永远相信的初心）因为一个人想要成为自己领域上的专家，必须要百分之百的投入。百分百的投入可以是很多的原因，可能是职场环境，自己认真负责，也有可能是兴趣使然，可以是被动的也可以是主动的。你想如果每天的坚持都做不到的话，那最后随着时间的消磨就慢慢老去。&lt;/p&gt;

&lt;p&gt;所以不忘初心，初心就是自己的目标，自己想要成为什么样的人，我相信有各种各样的书，表达了怎么去养成习惯，但是很多的书都没有教，可能也没法教怎么找到习惯的的初心，也就是你的目标，找到人生目标可能是一个高度私人化的事情，没法通过他人的劝诫和讨论，这个完全凭借内心的感受，每个人都是特殊的，每个人都应该为自己负责，知错犯错，一错再错就是不负责，为自己负责就是为了自己的幸福着想，我们需要理性的自己辅助自己一把，不断的复盘，一些事情可能发生的后果，类似的事情已经发生的后果，避免自己再次陷入同样的负担和困境，这就是为自己负责的好处，有一些假设可以预料产生的后果，自己要清醒的产生习惯，产生警醒。&lt;/p&gt;

&lt;p&gt;同样要绝对相信自己的判断，我的意思是相信自己对自己遇到的处境的判断，如果假设自己能正确的判断他人的走向，那就要相信自己判断的，目前面对的可能的危机，提前做出举措，避免同样的事情发生，要相信自己，相信自己走这么远靠的就是自己i的判断，但是也要运允许自己犯错，但是目前看来，我做的判断就不可能错误，因为这都是非常稳当，并且兜底的选择，我擅长兜底。我目前不擅长执行，但是我判断的能力还是自信的。&lt;/p&gt;

&lt;p&gt;低级娱乐就是像沼泽，慢慢的把人淹没，窒息。硕士毕业之前那段时间，吃饭和上厕所不刷手机，不刷Bilibili或者其他toxic habits，慢慢吃饭，就会觉得非常的平和peace。尽管那段时间并没有找到工作，也不知道未来。对自己有无条件盲目的自信，说话也不会so mean。不会暴躁。 当时可以清晰的感知，自己想要什么。想要为自己和为别人做点什么。自己需要什么，然后去做了。&lt;/p&gt;

&lt;p&gt;人都是一个情绪动物，身体上久坐的疲惫，工作上的价值感。 最让人兴奋的是，每天早上都积极的赶去工位的路上，创造有价值的事情，自己做了抗拒的事情，比如长时间的摸鱼。每天计划的指定。将人生目标穿插于工作之中。意思就是每天都要做的一些事情，生命中的意义感和挑战感。但是我们维持一些优秀的习惯不一定能实时的保证意义感和挑战感，有的时候因为难度太大，或者有的时候，因为训练的周期比较长，比如健身和英语。ok，健身可以把减肥的数字，拉动引体向上的数字当做目标。英语可以写一篇英文的文章，或者听一个纯英文的vlog，不开字幕，比如doomer的channel，没看懂不重要，但是重点就是参与进去。不过英语有很长时间无聊的积累的过程，如果能够每次每天都能坚持看无字幕的英语视频，就能够降低抵触心理，能够更好的融入英语为自己的生活习惯，把这个作为获得信息的一个窗口。看来又要下回Youtube.&lt;/p&gt;

&lt;p&gt;不过我觉得如果选择了，自己在体制外上班，并且追求财富自由（门槛不高的那种），和全球旅游的我来说，要注意自己选择的初心，以及记得自己是要打拼的决心， Don‘t waste time！&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>个人宝典</title>
   <link href="https://loredunk.github.io//blog/2024/10/07/%E6%80%8E%E4%B9%88%E8%88%92%E6%9C%8D%E7%9A%84%E7%94%9F%E6%B4%BB/"/>
   <updated>2024-10-07T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2024/10/07/怎么舒服的生活</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
今天有了时间对自己的生活进行总结和反思，我在人生中的确常常得出经验性的规律和总结，然后经过时间的冲刷，这些习惯都淡去了。
但是我觉得其实我也能像纳瓦尔宝典一样，写出个人宝典，不过不一定有这么泛化，而是更加私人的幸福/成功指南，这些一直都是我一些私人经验，对我还是非常make sense的。
&lt;/div&gt;

&lt;!--more--&gt;

&lt;ol&gt;
  &lt;li&gt;有鼻炎的困扰，不管怎么样都穿一双干净温暖的袜子。&lt;/li&gt;
  &lt;li&gt;出去旅行/出差/重要的事情，不管怎么样，都可以带一个耳塞作为应急。&lt;/li&gt;
  &lt;li&gt;早上起来，喝杯水，缺水会让人觉得疲惫。&lt;/li&gt;
  &lt;li&gt;用最简单能喝水的方法，每天经可能的喝水，原因多到我不知如何讲起，但是就是要喝水，怎么喜欢喝怎么来，珍惜可以放肆喝水的条件。&lt;/li&gt;
  &lt;li&gt;睡觉前不要喝水。&lt;/li&gt;
  &lt;li&gt;用洗发露洗头的时候，抓头抓的更慢一些。&lt;/li&gt;
  &lt;li&gt;给自己一定要空闲的时间去休息，去反思，去回顾和规划目标。&lt;/li&gt;
  &lt;li&gt;情绪和精力很容易受社交媒体的影响，尽量让自己保持无聊，这是非常可贵的状态，一旦被简单的多巴胺填满，人生会变得吃顿，很难有创造性和更多想象力空间。&lt;/li&gt;
  &lt;li&gt;吃饭上厕所的时候不要玩手机。&lt;/li&gt;
  &lt;li&gt;每天都要保持适当的运动，抵消久坐带来的伤害。比如做臀桥，也许一点点的力量驯良，就能抵消掉疼痛感。&lt;/li&gt;
  &lt;li&gt;大部分的时间都看着会发光的屏幕，观看墨水屏，就算仅仅是睡前的一个小时，也能减轻很多负担，这个不要用听东西去替代，因为听着就容易睡觉，但是睡前的一个小时，不玩的确就是有效的。&lt;/li&gt;
  &lt;li&gt;写博客，写东西去阐述自己观点，有时候说着就会发现漏洞。&lt;/li&gt;
  &lt;li&gt;虽然以上都是根据个人经验和经历来叙述的，但是这一条是我即将要做的，并且我惊讶的发现，这两年，我好像没有做成即使是我可以做到，但是规模中等的事情，比如完成技术博客和学习英语，这两件事只是有点点挑战性，但是却是不空闲下来复盘，是经常会忘掉的事情，我觉得可能是疲惫感让人容易怠慢，但是每天花时间做了以上的事情，肯定是能大量消除疲惫感的，这样的就有精力在业余或者在工作中，提升自己这一块的能力。我的确有很多事情想做，比如成为一个数字游民，和各个国家的人深入交流，学习更多英语工具，了解更多英语知识（就是因为使用的人多，而的确很多时候，中文的语料在某些程度具有局限性）&lt;/li&gt;
  &lt;li&gt;可以肯定是人自身的变化往往无法预料，并且人类讨厌一成不变，尤其是我自身，根本没法预料自身的走向，因此在这种背景下，自觉坚持一件有挑战事是非常反人性的，但是我也清晰的知道，达到这样的目的，必须要要之前的步骤，无法起空中楼阁。&lt;/li&gt;
  &lt;li&gt;真正成为专家需要百分百的投入。&lt;/li&gt;
  &lt;li&gt;简单快速的学习一个领域，利用好AI，就可以超过很多普通人对于这个领域的认知。&lt;/li&gt;
  &lt;li&gt;技能的扩展，是基于自身的基础，基础需要打好。&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;​&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>学习投资理财给我带来了什么</title>
   <link href="https://loredunk.github.io//blog/2024/08/28/%E4%BB%B7%E5%80%BC%E6%8A%95%E8%B5%84%E7%BB%99%E6%88%91%E5%B8%A6%E6%9D%A5%E4%BA%86%E4%BB%80%E4%B9%88/"/>
   <updated>2024-08-28T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2024/08/28/价值投资给我带来了什么</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
学习投资理财给我带来了什么
&lt;/div&gt;

&lt;p&gt;这里面记录了我对于价值投资的思考&lt;/p&gt;

&lt;!--more--&gt;

&lt;p&gt;今年刚步入工作，七月份给自己添办的第一个电子器件就是一本电纸书，同样这样也是送给自己的生日礼物。&lt;/p&gt;

&lt;p&gt;我想可能这会彻底改变我的人生，让我的更有可能实现人生目标以及拥有更强的抗风险能力。&lt;/p&gt;

&lt;p&gt;不过改变我的不是这个产品，而是这本电纸书自带赠送的一本收费的电子书，名字大概是叫半个小时教你理财的漫画课。尽管只能免费观看几十页，但是我被这个通俗粗糙的解释财务知识的内容所吸引，大概认识了关于指数基金，黄金以及债卷的概念，了解关于资产配置。不同投资风格的影响，还有投机和理财的区别。&lt;/p&gt;

&lt;p&gt;随后我在Youtube闲逛的时候，发现了标普500还有纳斯达克这种耳熟能详但是从未真正接触的概念，再到支付宝的场外购买，加上我本身在大模型行业中，并且对于AI大模型的落地应用有着非常看好的前景，我买入了我人生中第一个纳斯达克100场外基金，花了一百。&lt;/p&gt;

&lt;p&gt;好了铺垫这么多，我想说的第一点是，这本书给我带来的理财观念，给我最大的收益，不是教我复利，教我价值投资之类的。而是让我重新思考了我的消费习惯，站在年化率或者收益的角度上，比起去研究我每天的财富增长，似乎榨干我消费的水分，带来多余的现金存储，比我所遵循的保守稳健的长期投资带来的回报是要高的高的。&lt;/p&gt;

&lt;p&gt;包括我在阅读《金钱心理学》这本中外知名的理财书籍的时候， 发现很多观点都十分一针见血，比如我昨天晚上阅读到的，关于人生幸福的讨论就是，人对自己人生的掌控感，人不喜欢被人指使，并且碰到风险的时候无力抵抗，通勤长的时候，每天挤地铁，深圳这个地铁赶早高峰痛苦面具直接带上了好吗。根本大家都像比赛一样拼命的挤上车和挤下来。&lt;/p&gt;

&lt;p&gt;手里有了储蓄，对自己的人生才有了掌控感，而你在大笔冲动消费之后，带给你的空虚和无法掌握的人生轨迹偏离感，正好挤兑掉了你的幸福感，当&lt;strong&gt;你的欲望和你的所得拉的差距越大，你就越容易生活舒适&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;而且一些专业投资者花费上亿的投资，为了将他们的财务增长百分之0.1，从而可想像，增长我的财务收入，和控制自己欲望与收入的差距哪个难度更大了。而这一切的目的，都是赚够金钱，让我们对人生有足够的掌控感。&lt;/p&gt;

&lt;p&gt;不过我也承认，有的时候，比如创业，是需要承担风险的。很多东西都不是可以掌控的。但是拥有掌控感的当下，你是用金钱购买了自由，你可以fuck you你的环境，你可以不用担心一些事情，你可以保持良好的心理健康去学习更多的东西，大脑里的存货足够，这些掌控感到后期是能支持你有能力去冒险实现你的人生目标的。&lt;/p&gt;

&lt;p&gt;收入超过一个水平之后，你满足了你的基本物质需求之后，多出来的那部分，大体成为了虚荣物质的反应，大概也是向别人展示你有多行，多有钱，或者多有水平，如果是这样，那增长你财富最好的方法，不是去赚更多的钱，而是培训你的谦逊之心。&lt;/p&gt;

&lt;p&gt;《金钱心理学》中有一个观点非常有意思，叫做豪车悖论，说大家看到豪车的第一反应，不是真的憧憬你，而是憧憬成为你，透过你，把你当做人生的一个旗帜，幻想成为你，会被多少人所羡慕，幻想成为你，从而享受那个光环。如果开豪车真的非常爽，那成为一个泊车的，可能是容易达到的人生目标。事实上，其他人常常会跳过敬仰你这一步，不是因为他们觉得你的财富不值得羡慕，而是因为他们把你的财富当做标尺，转而表达自己渴望被爱慕与敬仰的愿望。&lt;/p&gt;

</content>
 </entry>
 
 <entry>
   <title>STAM - Spiking Graph Convolutional Networks</title>
   <link href="https://loredunk.github.io//blog/2022/10/18/Spiking-Graph-Convolutional-Networks/"/>
   <updated>2022-10-18T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2022/10/18/Spiking-Graph-Convolutional-Networks</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
图卷积网络和脉冲神经网络的结合
&lt;/div&gt;

&lt;p&gt;本文采用的是时间驱动的脉冲时间网络，基于Spikingjelly框架。&lt;/p&gt;

&lt;!--more--&gt;

&lt;p&gt;根据对本文及Spiking neural network的了解，将回答几个问题：&lt;/p&gt;

&lt;ul&gt;
  &lt;li&gt;GCN在本文是干嘛的&lt;/li&gt;
  &lt;li&gt;在输入SNN编码器之前卷积的结果是什么？
    &lt;ul&gt;
      &lt;li&gt;输出一个卷积得出的矩阵和一个tag&lt;/li&gt;
    &lt;/ul&gt;
  &lt;/li&gt;
  &lt;li&gt;为什么说擅长处理时间序列数据。&lt;/li&gt;
  &lt;li&gt;如果擅长处理时序数据，是否意味着可应用于序列推荐。&lt;/li&gt;
&lt;/ul&gt;

&lt;h2 id=&quot;gcn在本文是什么作用&quot;&gt;GCN在本文是什么作用&lt;/h2&gt;

&lt;p&gt;GCN是在输入模型之前，进行一个输入至SNN之前初始化的部分，将数据进行图卷积聚合，&lt;/p&gt;

&lt;p&gt;（这里需要结合代码）&lt;/p&gt;

&lt;h2 id=&quot;gcn聚合之后通过encoder转换成spikes如何转换&quot;&gt;GCN聚合之后，通过Encoder转换成spikes,如何转换？&lt;/h2&gt;

&lt;p&gt;本文提出使用probability-based Bernoulli encoding作为转换node representation到spike signals的方法，本文假设representation的重要性应该和spiking rate成正比的关系，在基于Bernoulli encoder，&lt;/p&gt;

&lt;blockquote&gt;
  &lt;p&gt;发射脉冲还有几率的？，难道不是到了膜电位，直接就发射吗？还是说到了膜电位再考虑要不要发射，弄清楚什么是发射率。还有弄清楚什么是脉冲,什么是spike, spike就是脉冲吗？&lt;/p&gt;

  &lt;p&gt;pre-synaptic spike是不是0.0342之类的连续值电压，还是0，1的离散电压。&lt;/p&gt;

&lt;/blockquote&gt;

&lt;p&gt;$\lambda_{i，j}$是i节点的第j个特征的node representation（这是什么意思），这个源自于图卷积的结果。这个值和特征重要性正相关，值越大，被encoder发射spike的几率越大。&lt;/p&gt;

&lt;p&gt;把encoding模组视为图的采样过程，将T time steps表示为重复采样的过程，T time同样也能视为信息encoded的分辨率。&lt;/p&gt;

&lt;p&gt;（结合代码）&lt;/p&gt;

&lt;h2 id=&quot;charge-fire-and-reset&quot;&gt;Charge, fire and reset&lt;/h2&gt;

&lt;p&gt;这个模组分为fully connected layer层和LIF神经元，connected layer输入是spike，输出是voltages电压至LIF神经元，LIF就能发射脉冲以及重置膜电位。&lt;/p&gt;

&lt;blockquote&gt;
  &lt;p&gt;每个节点是特征吗，是整个图是一个文章，还是整个图是所有的数据，每个节点有不同的特征？每个节点是条长向量？&lt;/p&gt;

  &lt;p&gt;代码里面的img是什么？encoder之后是什么样的？ 每个节点的每个特征都encoder了嘛？是什么过程？&lt;/p&gt;

  &lt;p&gt;img就是已经GCN聚合过后的矩阵【bath_size,fearture nums】,encoder了之后，经过possion抽样，每个元素都有不同概率的可以经过抽样，通过了possion的概率的，就为true vise verse.&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;通常，深度SNN会采用线性或者非线性的组合来处理输入，但是根据SGC来的说法，预测未知的标签，SNN的深度是不重要的，所以本文丢掉了多余的模组，只留下了全连接层。&lt;/p&gt;

&lt;h2 id=&quot;gradient-surrogate&quot;&gt;Gradient surrogate&lt;/h2&gt;

&lt;blockquote&gt;
  &lt;p&gt;梯度替代是在哪里表现的？什么环节发力的，为什么代码中没有？&lt;/p&gt;
&lt;/blockquote&gt;

&lt;h2 id=&quot;模型可行性分析&quot;&gt;模型可行性分析&lt;/h2&gt;

&lt;p&gt;提出的方法真的对预测任务有效吗？&lt;/p&gt;

&lt;p&gt;相比于其他GCN模型，我们怎么采样过程中控制信息的衰减？&lt;/p&gt;

&lt;p&gt;顺便还解释一下spike representation $\psi_{j} o_{j}$有很高的概率接近真实值输出。&lt;/p&gt;

&lt;p&gt;文章用了SGC进行对比. SGC和本文采用了相似的框架，将卷积结果H输入全连接层，用真实值的形式。&lt;/p&gt;

&lt;p&gt;在SGC中假设真实卷积值是$\lambda$，spike representation是o。&lt;/p&gt;

&lt;p&gt;$\operatorname{Pr}\left(o_{j}=1\right)=\lambda_{j}, \quad \operatorname{Pr}\left(o_{j}=0\right)=1-\lambda_{j}$&lt;/p&gt;

&lt;p&gt;每个节点的spiking representation &lt;strong&gt;$O_{i, t}^{p r e}=\left(o_{1}, \ldots, o_{j}, \ldots, o_{d}\right)$&lt;/strong&gt; 是这样的，节点的每个维度都是独立发射&lt;strong&gt;spike&lt;/strong&gt;的。Pr（o=0/1）就是发射脉冲1的几率等于真实值。&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>STAM - A Spatiotemporal Aggregation Method for Graph Neural Network-based Recommendation</title>
   <link href="https://loredunk.github.io//blog/2022/06/27/STAM-A-Spatiotemporal-Aggregation-Method-for-Graph-Neural/"/>
   <updated>2022-06-27T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2022/06/27/STAM-A-Spatiotemporal-Aggregation-Method-for-Graph-Neural</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
利用时空聚合方法与图神经网络推荐方法的结合，超越LightGCN?
&lt;/div&gt;
&lt;p&gt;测试一下vim的流程
图神经网络推荐系统的关键核心就是制造邻居的embedding learning，之前的工作都聚焦于空间上的聚合，但是时空上的研究还是比较少，STAM采用Scaled-Dot-Product Attention去one-hop的时空顺序，采用多头注意力机制去进行joint attention在不同的隐藏子空间，本文的实验表明，时空聚合方法在MRR@20指标上MovieLens上超越24%，Amazon上超越8%，淘宝上超过13%。
Mac～～
&lt;!--more--&gt;&lt;/p&gt;

&lt;p&gt;疑问： 图序列推荐不是也包含了时间信息么，两者有什么区别呢？&lt;/p&gt;

&lt;p&gt;在这个论文里面我们跟Lightgcn一样，也省去了非线性变换，从以往的基于空间的聚合的方法来说，用两个人来举例，如果他们交互的物品都一样，那么他们都会得到同样的推荐商品，但是如果基于我们的时空聚合的方法来说，就算推荐的东西一样，但是点击顺序不一样，系统所推荐的东西便不一样。&lt;/p&gt;

&lt;p&gt;这个文章的比较对象是&lt;strong&gt;序列推荐&lt;/strong&gt;，以及其他基于空间上聚合的GNN模型。&lt;/p&gt;

&lt;h2 id=&quot;2基于gnn的推荐的介绍&quot;&gt;2.基于GNN的推荐的介绍&lt;/h2&gt;

&lt;p&gt;2.1 Embedding layer&lt;/p&gt;

&lt;p&gt;用处就是讲one-hot 表示进行一个到低维稠密的向量上，起到一个初始化的作用，其数值还能通过聚合和传播进行更新。&lt;/p&gt;

&lt;p&gt;2.2 embedding aggregation layer&lt;/p&gt;

&lt;p&gt;这个主要是负责聚合领域信息，在user-item图中，一共有两种聚合操作，item聚合和user聚合，&lt;/p&gt;

&lt;p&gt;2.3 embedding propagation layer&lt;/p&gt;

&lt;p&gt;也是分两步，先聚合邻居点，然后把邻居点和自己的embedding输入一个update函数，进行更新。&lt;/p&gt;

\[\begin{aligned}
&amp;amp;\mathbf{n}_{u}^{(l+1)}=f_{u \leftarrow v}\left(\mathbf{h}_{v}^{(l)} \mid v \in \mathcal{N}_{u}\right) \\
&amp;amp;\mathbf{h}_{u}^{(l+1)}=g\left(\mathbf{n}_{u}^{(l+1)}, \mathbf{h}_{u}^{(l)}\right)
\end{aligned}\]

&lt;p&gt;2.4 prediction layer&lt;/p&gt;

&lt;p&gt;先是将l层的u节点的邻居v的embedding融合成一个l+1层的一个固定长度的vector n，然后再将n与l层的u进行一个update的操作。&lt;/p&gt;

\[\begin{aligned}
&amp;amp;\mathbf{e}_{u}^{*}=o\left(\mathbf{h}_{u}^{(1)}, \cdots, \mathbf{h}_{u}^{(L)}\right) \\
&amp;amp;\mathbf{e}_{v}^{*}=o\left(\mathbf{h}_{v}^{(1)}, \cdots, \mathbf{h}_{v}^{(L)}\right)
\end{aligned}\]

&lt;h2 id=&quot;stam的架构&quot;&gt;STAM的架构&lt;/h2&gt;

&lt;p&gt;&lt;img src=&quot;images/image-20220705183148173.png&quot; alt=&quot;image-20220705183148173&quot; /&gt;&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>Contrastive Learning for Sequential Recommendation</title>
   <link href="https://loredunk.github.io//blog/2022/05/31/Contrastive-Learning-for-Sequential-Recommendation/"/>
   <updated>2022-05-31T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2022/05/31/Contrastive-Learning-for-Sequential-Recommendation</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
对比学习之序列推荐
&lt;/div&gt;

&lt;!--more--&gt;

&lt;h4 id=&quot;contrastive-loss-function&quot;&gt;contrastive loss function&lt;/h4&gt;

&lt;p&gt;对比损失函数用于区分两个表示是否源于一个相同用户的历史序列。为了达到这个效果，要最小化同一序列不同增广视角的区别。&lt;/p&gt;

&lt;p&gt;对每个用户的序列使用两种随机的增强方法，最后获得2N个被增强的序列，取一个用户的两个增强视角作为正样本对，其他2（N-1）个负样本对。&lt;/p&gt;

&lt;h3 id=&quot;数据增强操作&quot;&gt;数据增强操作&lt;/h3&gt;
</content>
 </entry>
 
 <entry>
   <title>How to Build Your Personal Blog on Github Page</title>
   <link href="https://loredunk.github.io//blog/2022/05/14/How-to-Build-Your-Personal-Blog-on-Github-Page/"/>
   <updated>2022-05-14T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2022/05/14/How-to-Build-Your-Personal-Blog-on-Github-Page</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
教你如何使用github page搭建网页&lt;br /&gt;
静态网页模板jekyll;显示Latex数学公式用到了mathjax; 图床使用到了github+PicGo的方式,配合typora和最好用的截图工具snipaste。
&lt;/div&gt;

&lt;!--more--&gt;
</content>
 </entry>
 
 <entry>
   <title>Sequential Recommendation with Graph Neural Networks</title>
   <link href="https://loredunk.github.io//blog/2022/05/10/Sequential-Recommendation-with-Graph-Neural-Networks/"/>
   <updated>2022-05-10T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2022/05/10/Sequential-Recommendation-with-Graph-Neural-Networks</id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
	此次尝试边看文献，边记笔记。
&lt;/div&gt;

&lt;h2 id=&quot;摘要&quot;&gt;摘要&lt;/h2&gt;

&lt;p&gt;为什么要生成密集的聚类在兴趣图中？&lt;/p&gt;

&lt;p&gt;cluster-aware和query-aware是什么？加一个aware代表什么？&lt;/p&gt;

&lt;p&gt;什么是图池化graph pooling&lt;/p&gt;

&lt;p&gt;图池化就是将图分为不同子图，每个子图进行合并或者取重要的节点，来代替原来的子图。&lt;/p&gt;

&lt;!--more--&gt;

&lt;h2 id=&quot;引言&quot;&gt;引言&lt;/h2&gt;

&lt;p&gt;为了区分传统的推荐模型，他们往往都是在静态的用户行为上建模，而序列推荐捕捉的是用户的动态行为。以前的工作用RNN进行建模用户行为，缺点就是只能捕获短期行为序列，很难建模长期的行为，最近的一些工作就是将长期和短期兴趣进行联合建模，避免forgetting long-term兴趣。&lt;/p&gt;

&lt;p&gt;我们提出了图卷积网络取提取隐形偏好信号，动态的图池化用来捕捉动态的偏好。&lt;/p&gt;

&lt;h2 id=&quot;方法&quot;&gt;方法&lt;/h2&gt;

&lt;p&gt;什么是interest graph?&lt;/p&gt;

&lt;p&gt;我们将SURGE模型分成了四个部分。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;https://s2.loli.net/2022/05/15/iANj5kl7ueJD26q.png&quot; alt=&quot;&quot; /&gt;&lt;/p&gt;

&lt;h4 id=&quot;第一部分interest-graph-construction&quot;&gt;第一部分interest graph construction&lt;/h4&gt;

&lt;p&gt;将稀疏的item序列构建成item-item 基于metric learning的interest graphs。&lt;/p&gt;

&lt;p&gt;为了整合和区分不同基于用户丰富的历史行为类型的偏好，将零散的iem序列转换成item-item 兴趣图。挑战是太过稀疏，很难转换成共现关系，难以对每个用户产生连接图，在这个部分，作者提出一个基于metric learning的新方法，自动得将每个交互序列组建成图结构取探索兴趣的分布。&lt;/p&gt;

&lt;p&gt;我们旨在学习邻接矩阵A，每个边代表item i和j的连接。&lt;/p&gt;

&lt;p&gt;最重要的兴趣有更高的degree相比边界的兴趣节点，因为他们连接了更多的相似的兴趣，一个先验的框架产生了，邻居节点是相似的，稠密的子图是用户的核心/重要兴趣。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;节点相似metric学习&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;通常的metric learning应该是可以被分类成kernel-based 和attion-based mothods&lt;/p&gt;

&lt;p&gt;通常kernel-based方法包括余弦相似度，欧氏距离，和Mahalanobis distance。一个好的相似度metric function应该是可以去学习的以至于提升表达能力以及有合理的复杂度。&lt;/p&gt;

&lt;p&gt;为了平衡可以表达能力和复杂性，我们采取加权余弦相似度。我们的metric function可以用公式表达为。
\(M_{i j}=\cos \left(\overrightarrow{\mathbf{w}} \odot \vec{h}_{i}, \overrightarrow{\mathbf{w}} \odot \vec{h}_{j}\right)\)&lt;/p&gt;

&lt;p&gt;其中$\odot$ 的表示hadamard乘积，$\overrightarrow{\mathbf{w}}$ 表示一个可训练的权值向量，用来适应性的强调item的不同维度的embedding hi和hj。可学习的图结构不停地使item embedding的更新。&lt;/p&gt;

&lt;p&gt;为了增加表现力和学习过程地稳定性，metric function可以被扩展成多头metric。然后我们可以扩展一下多头的，把其演变为最终的相似性方程：
\(M_{i j}^{\delta}=\cos \left(\overrightarrow{\mathbf{w}}_{\delta} \odot \vec{h}_{i}, \overrightarrow{\mathbf{w}}_{\delta} \odot \vec{h}_{j}\right), \quad M_{i j}=\frac{1}{\delta} \sum_{\delta=1}^{\phi} M_{i j}^{\delta}\)
每个头${\delta}$ 都代表这隐含地捕捉了不同语义的特征。&lt;/p&gt;

&lt;p&gt;我们采用relative ranking strategy of the entire graph。 我们将M中小鱼非负阈值的给mask掉，设置为0.通过排序M中的metric value，我们可以得到
\(A_{i j}= \begin{cases}1, &amp;amp; M_{i j}&amp;gt;=\mathbf{R a n k}_{\varepsilon n^{2}}(M) \\ 0, &amp;amp; \text { otherwise }\end{cases}\)
rank函数返回排序后前en^2位的值。其他的为0。&lt;/p&gt;

&lt;p&gt;不同于absolute threshold strategy of the entire graph [5] 和relative ranking strategy of the node neighborhood [4, 19]. 前者如果超参设置的不妥当，那么这个emebdding不断地更新之后，metric value分布也将改变，也许不太可能产生一个图或者产生一个完整的图。后者返回的是一个邻接矩阵的每一行的固定数目的最大值的索引。这个使得生成图有同样的度。强制同样的稀疏分布将会使得下游GCN不可以取完整的理由图的密集或者稀疏结构信息。&lt;/p&gt;

&lt;h4 id=&quot;第二部分interest-fusion-graph-convolutional-layer&quot;&gt;第二部分interest-fusion graph convolutional layer&lt;/h4&gt;

&lt;p&gt;增强重要的行为的，削弱噪音行为&lt;/p&gt;

&lt;p&gt;我们提出了cluster- and query-aware graph attentive convolutional layer可以收到用户的核心兴趣。位于cluster中心的item。&lt;/p&gt;

&lt;p&gt;can perceive the user’s core interest (i.e., the item located in the cluster center) and the interest related to &lt;strong&gt;query interest&lt;/strong&gt; (i.e., current target item)&lt;/p&gt;

&lt;p&gt;这句话什么意思？什么是query interest？&lt;/p&gt;

&lt;p&gt;输入是用户交互序列的节点长度，这一层产生一个新的节点embedding martix。作为其潜在的不同维度的输出。&lt;/p&gt;

&lt;p&gt;**计算对齐评分Eij，将目标节点vi的重要性映射到其邻居节点vj上  **（不懂）&lt;/p&gt;

&lt;p&gt;一旦获得了对齐评分，使用归一化注意系数对它们对应的embedding进行加权组合，&lt;br /&gt;
\(\vec{h}_{i}^{\prime}=\sigma\left(\mathbf{W}_{\mathbf{a}} \cdot \text { Aggregate }\left(E_{i j} * \vec{h}_{j} \mid j \in \mathcal{N}_{i}\right)+\vec{h}_{i}\right)\)
这个aggregate 可以是mean，sum max GRU等等。本论文使用简单sum方程，为了稳定attention机制的学习过程，我们采用了多头注意力，准确来说，多头独立注意力机制执行了以上的变换，他们的embedding被下列的输出所拼接。
\(\vec{h}_{i}^{\prime}=\|_{\delta=1}^{\phi} \sigma\left(\mathbf{W}_{\mathbf{a}}^{\delta} \cdot \text { Aggregate }\left(E_{i j}^{\delta} * \vec{h}_{j} \mid j \in \mathcal{N}_{i}\right)+\vec{h}_{i}\right),\)
Eij是通过多头获得的归一化的&lt;strong&gt;注意力系数&lt;/strong&gt; 什么是注意力系数？。Wa是对应的线性变化权重矩阵。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Cluster- and query-aware attention&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;为了增强重要的信号和减弱噪音，提出了cluster和query aware注意力机制，使用注意力系数取重新分布消息传递过程中边的信息，注意力机制主要考虑两点：&lt;/p&gt;

&lt;p&gt;首先，我们假设Vi的邻居将形成聚类，然后Vi是聚类的中心，我们定义目标节点Vi的K-hop定义为cluster的感知域。在聚类中所有节点的embedding的平均值代表一个聚类的平均信息，取鉴别这个目标节点是否是聚类的中心，这个目标节点的embedding和他的聚类embedding通常被用于计算下类的attention score。
\(\alpha_{i}=\text { Attention }_{c}\left(\mathbf{W}_{\mathbf{c}} \vec{h}_{i}\left\|\vec{h}_{i_{c}}\right\| \mathbf{W}_{\mathbf{c}} \vec{h}_{i} \odot \vec{h}_{i_{c}}\right)\)
Wc是变换矩阵，II是拼接操作，点积是Hadamard乘积，也就是两个向量或者矩阵，每个对应的元素进行相乘。在我们的实验里，attention机制的attetionc是一个两层的前馈神经网络。LeakyReLu作为激活函数。&lt;/p&gt;

&lt;p&gt;​	为了服务下游动态池化方法和学习用户对于不同目标兴趣的 interest’s independent 发展演变，源节点embedding hj和目标item embedding ht的关联也应该被思考，如果源节点和query item更加相关，那他的权重在对目标节点的聚合过程中更加重要。
\(\beta_{j}=\text { Attention }_{q}\left(\mathbf{W}_{\mathbf{q}} \vec{h}_{j}\left\|\vec{h}_{t}\right\| \mathbf{W}_{\mathbf{q}} \vec{h}_{j} \odot \vec{h}_{t}\right)\)
Wq是一个变化矩阵，在我们的实验中，注意力q是两层的前馈网络，同样也应用LeakyReLu.&lt;/p&gt;

&lt;p&gt;我们将目标节点的cluster分数和源节点的query score分数相加作为source node j对于target node i的权重，为了让系数更容易地有可比性在不同地节点上，我们采用了softmax 方程，取正则化他们，注意力系数Eij is computed as:
\(E_{i j}=\operatorname{softmax}_{j}\left(\alpha_{i}+\beta_{j}\right)=\frac{\exp \left(\alpha_{i}+\beta_{j}\right)}{\sum_{k \in \mathcal{N}_{i}} \exp \left(\alpha_{i}+\beta_{k}\right)},\)&lt;/p&gt;

&lt;p&gt;节点i地邻居Ni包括了节点i，在&lt;strong&gt;自循环传播&lt;/strong&gt;？ 这是什么？ （when i equels j）ai控制目标节点接受多少信息，Bj控制源节点发送多少信息。&lt;/p&gt;

&lt;h4 id=&quot;第三部分interest-extraction-graph-pooling-layer&quot;&gt;第三部分interest-extraction graph pooling layer&lt;/h4&gt;

&lt;p&gt;动态的图池化旨在适应性的动态保留激活的核心偏好。&lt;/p&gt;

&lt;p&gt;通过对图结构粗化，稀疏的兴趣被转换成了稠密的兴趣。&lt;/p&gt;

&lt;p&gt;为了做图池化，a cluster assignment matrix is necessary。 cluster assignment是给不同得节点分配不同得聚类，不同节点在不同聚类有不同的概率。&lt;/p&gt;

&lt;p&gt;我们使用GNN去产生分配矩阵。
\(S_{i:}=\operatorname{softmax}\left(\mathbf{W}_{\mathbf{p}} \cdot \text { Aggregate }\left(A_{i j} * \vec{h}_{j}^{\prime} \mid j \in \mathcal{N}_{i}\right)\right)\)
权重矩阵Wp的输出维度 对应cluster m的最大数字，softmax方程被用于预测第i个节点的被分到m cluster的可能性，值得注意的是我们可以通过SAS获得池化的邻接矩阵。&lt;/p&gt;

&lt;p&gt;重复上面这个等式可以执行多层的池化。&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Assignment regularion&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;仅使用梯度信号是很难训练cluster assignment matrix S. 非凸优化问题很容易让这个变成局部最优，在早期的训练阶段，本文采取了三种regularization方法。&lt;/p&gt;

&lt;p&gt;第三种方法，Relative position regularization&lt;/p&gt;

&lt;p&gt;用户在池化的前后需要保证用户的时间顺序，然而在pooled culster embedding martix 上swapping the index的操作的事不可微的，所以我们发明了Relative position regularization。确保cluster在pooling中的时序顺序。
\(L_{\mathrm{P}}=\left\|P_{n} S, P_{m}\right\|_{2}\)
最小化L2 norm让S中非零元素的位置更加接近主对角元素，&lt;/p&gt;

&lt;p&gt;直觉来说，原始序列在前的节点，cluster的位置index也在前。but 啥是&lt;strong&gt;cluster的position index&lt;/strong&gt;。
\(\vec{h}_{g}=\operatorname{Readout}\left(\left\{\gamma_{i} * \vec{h}_{i}^{\prime}, i \in \mathcal{G}\right\}\right)\)
Readout这里是sum. 确保排列的不变性。&lt;/p&gt;

&lt;h4 id=&quot;第四部分prediction-layer&quot;&gt;第四部分prediction layer&lt;/h4&gt;

&lt;p&gt;在图池化被拉平成reduced sequences后，作者建模了&lt;em&gt;增强的进化的兴趣信号&lt;/em&gt;？ we model the evolution of the enhanced interest signals是什么意思？预测下一个用户最有可能Interact的item。&lt;/p&gt;

&lt;p&gt;什么是reduced sequences? 怎么拉平的？&lt;/p&gt;

&lt;p&gt;仅仅考虑readout操作是不会考虑到重要兴趣之间的变化。无疑造成了时序偏见。&lt;/p&gt;

&lt;p&gt;为了将最后的兴趣的表示添加相对的历史信息。思考不同的兴趣之间的时序关系也是很重要的。
\(\vec{h}_{s}=\operatorname{AUGRU}\left(\left\{\vec{h}_{1}^{*}, \vec{h}_{2}^{*}, \ldots, \vec{h}_{m}^{*}\right\}\right)\)
GRU克服了RNN的梯度消失的问题，并且快于LSTM。而且为了让fused interest 的重要性权重更好的使用，我们采取了attentional update gate GRU。无缝的混合GRU和注意力机制。&lt;strong&gt;[45Deep interest evolution network for click-through rate prediction]&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;AUGRU能让不相关的兴趣在hidden state中造成更少的影响。避免了兴趣drifting的干扰，我理解drifting就是不稳定的兴趣。&lt;/p&gt;

&lt;p&gt;我们将interest extraction layer and evolution output of the interest evolution layer的graph level representation作为用户的当前兴趣。&lt;/p&gt;

&lt;p&gt;拼接的稠密表示向量，全连接层被自动地学习embedding的混合。&lt;/p&gt;

&lt;p&gt;我们使用两层的前馈神经网络作为预测方程去评估用户在下一刻交互item的可能性，
\(\hat{y}=\operatorname{Predict}\left(\vec{h}_{s}\left\|\vec{h}_{g}\right\| \vec{h}_{t} \| \vec{h}_{g} \odot \vec{h}_{t}\right)\)
所有被比较的模型都用了这个流行的预测方程，借用真实工业使用CTR预测，我们使用负对数似然方程作为损失函数，就跟所有被比较的模型一样，
\(L=-\frac{1}{|O|} \sum_{o \in O}\left(y_{o} \log \hat{y}_{o}+\left(1-y_{o}\right) \log \left(1-\hat{y}_{o}\right)\right)+\lambda\|\Theta\|_{2}\)
O是训练集，|O|是训练instrances的个数，$\Theta$ 表示可训练的参数，$\lambda$ 控制惩罚力度。&lt;/p&gt;

&lt;h2 id=&quot;实验&quot;&gt;实验&lt;/h2&gt;

&lt;ol&gt;
  &lt;li&gt;我们是怎么比较最好的序列推荐的&lt;/li&gt;
  &lt;li&gt;我们可以有效的处理不同长度的推荐吗啊&lt;/li&gt;
  &lt;li&gt;这个方法的不同组件有什么不同的影响&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;这个实验用了淘宝和快手的数据集&lt;/p&gt;

&lt;p&gt;淘宝用了2017年十一月25到十二月3号的数据，并且过滤掉了低于10个交互物品的用户，我们使用头七天作为训练集，后面第8天作为验证集，最后一天作为测试集。 到了50就截断&lt;/p&gt;

&lt;p&gt;快手的是2020年10月22到10月28，也是筛掉了10个以下的用户和视频。 到了250 就截断&lt;/p&gt;

&lt;p&gt;看了一下【20】文献，同样也是用淘宝的，但是是只是向下截断200条。&lt;/p&gt;

&lt;p&gt;用了四种metrics&lt;/p&gt;

&lt;p&gt;AUC 正样本分数高于负样本分数几率，反映了分类模型的rank 样本的能力。&lt;/p&gt;

&lt;p&gt;GAUC 执行了每个用户AUC的权重平均。权重是点击数&lt;/p&gt;

&lt;p&gt;MRR 正确答案的排名的倒数的平均，&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;https://s2.loli.net/2022/05/15/xVGnUTtLkbOlMX8.png&quot; alt=&quot;&quot; /&gt;&lt;/p&gt;

&lt;p&gt;NDCG@K 分数高得排在前面，指标就越高。 这里跟其他的现存的工作一样，K取个2。&lt;/p&gt;

&lt;p&gt;值得注意的是session recommendation是另一种类似于序列推荐的推荐任务，只不过他们只用了用户当前的session data没有利用long-term偏好的数据。&lt;/p&gt;

&lt;h4 id=&quot;超参设置&quot;&gt;超参设置&lt;/h4&gt;

&lt;p&gt;Adam优化，初始学习率0.001 batch size 500, embedding size 40, Xavier初始化来初始化参数。使用网格搜索取寻找最好的超参。All regularization coefficients are searched in [1e −7 , 1e −5 , 1e −3 ].The pooling length of the user interaction sequence is searched in [10, 20, 30, 40, 50] for Taobao dataset and [50, 100, 150, 200, 250] for Kuaishou dataset。 &lt;strong&gt;pooling length是什么东西&lt;/strong&gt;？&lt;/p&gt;

&lt;p&gt;序列推荐虽好，但是有一个问题，就是基于RNN的序列推荐，当处理更长的数据集时，很容易忘记long-term 兴趣序列，另外长序列包含更多的噪音，DIEN相比于GRU4REC模型更加不稳定，即使两层的GRU结构更有效，但是遇到长的序列。很容易受到噪声的影响，因此证明了我们使用metric learning的动机。&lt;/p&gt;

&lt;h5 id=&quot;联合训练长和短term的兴趣不会累加起来产生更好的表现&quot;&gt;联合训练长和短term的兴趣不会累加起来产生更好的表现。&lt;/h5&gt;

&lt;p&gt;Sli-Rec 结合了长期和短期的兴趣，在Taobao上是AUC最好的Baseline了，但是对于其他的RANKING metric，他们的表现很差。&lt;/p&gt;

&lt;h2 id=&quot;related-work&quot;&gt;Related Work&lt;/h2&gt;

&lt;p&gt;我们认为序列行为只是反映了微弱的偏好信号，用户偏好的一部分在某个&lt;/p&gt;
</content>
 </entry>
 
 <entry>
   <title>Deep Neural Networks for YouTube Recommendations</title>
   <link href="https://loredunk.github.io//blog/2022/05/07/Deep-Neural-Networks-for-YouTube-Recommendations/"/>
   <updated>2022-05-07T00:00:00+00:00</updated>
   <id>https://loredunk.github.io//blog/2022/05/07/Deep-Neural-Networks-for-YouTube-Recommendations </id>
   <content type="html">&lt;div class=&quot;message&quot;&gt;
   	不得不说，大部分中国人写的英文论文和navtive speaker写的英文论文区别还是大的。。
&lt;/div&gt;

&lt;h2 id=&quot;解决了几个问题&quot;&gt;解决了几个问题&lt;/h2&gt;

&lt;p&gt;yaml一定要注意：后面会有一个空格，还有如果要写html格式的，class=”” “”“ 中文和英文在markdown上的双引号十分相似。&lt;a href=&quot;https://developer.mozilla.org/en-US/docs/Web/HTML/Element&quot;&gt;Mozilla Developer Network&lt;/a&gt;.&lt;/p&gt;

&lt;!--more--&gt;

&lt;ul&gt;
  &lt;li&gt;测试一下&lt;strong&gt;黑体&lt;/strong&gt;&lt;/li&gt;
  &lt;li&gt;测试一下&lt;em&gt;斜体&lt;/em&gt;&lt;/li&gt;
  &lt;li&gt;测试&lt;/li&gt;
&lt;/ul&gt;
</content>
 </entry>
 

</feed>
