Claude vs ChatGPT 做香港金融分析:我跑过的 4 个测试
目录
Claude vs ChatGPT 做香港金融分析:我跑过的 4 个测试
最后更新:2026-05-26
作者 Jim Liu — 跟踪了 27 只香港 IPO 的港/澳散户,LRTS 107 只 IPO 数据集维护者。
摘要(TL;DR)
- 我把 Claude(Sonnet 4.5)和 ChatGPT(GPT-4o)放在一起跑了同样的四个任务,全都是我每周分析工作里真实会做的事。
- 长文本任务 Claude 赢——香港 IPO 招股书解析、HKMA 稳定币法规阅读,它能一口气吃完 200 多页的 PDF 不掉链子。
- 计算类任务 ChatGPT 更顺手,尤其是股息 DCF 和多券商费用对比,因为它能调代码解释器。
- 两个都不是持牌顾问。我把它们推到训练截止之后的港股细节时,都会出现幻觉。审计轨迹比那个标题答案重要得多。
- 分析师全月用量:单订一个大概 USD 25–40/月,两个都跑像我这样大概 USD 60/月。
我把 Claude 和 ChatGPT 同时跑大概是十个月之前开始的,起因是一份富途的招股书把我整个星期天耗掉了。读者和我自己邮件订阅列表里反复出现的问题就是:到底哪一个真的更适合做香港金融分析。不是「哪个写文章更好看」。具体一点:我要读一份 18C 章的科技招股书、要给一只股息股建模、要对比券商费用、要解析 HKMA 的稳定币框架,我会更信任哪一个。
下面就是诚实的回答。四个测试,一个分析师,没有任何联盟链接的角度。两个订阅都是我自己掏钱。
先说明一句。我是个散户投资者,不是持牌顾问,也不是 AI 研究员。我是当一个每天都要用的分析师在跑这两个工具,跑的是真实的工作,输出真实的结果。你的体感肯定会不一样。
我为什么要测这两个:香港分析师的真实场景
有一类工作,多数面向散户的香港分析师内容都会跳过,但偏偏是我每周都要做的。
大致三类。长文档解析——香港 IPO 招股书一份 300 到 600 页 PDF,经常英文版和繁体中文版还拼在一起。定量建模——股息收益率推算、精确到三位小数的港币券商费用表、要做汇率调整的 DCF。法规阅读——HKMA 通函、SFC 指引、今年刚落地的稳定币条例,这些今年都在动。
AI 工具最初出来那阵子,我以为它们做这类活儿应该差不多。用了十个月之后我可以确定:不是。每个都有自己的性格,而性格这个东西,在你要在某个 IPO 截单日决定要不要押钱的时候,是会出事的。
所以我设计了四个任务。同样的 prompt 给两边。同样的输入数据。我从四个维度打分:香港监管准确度、计算可靠性、审计轨迹(我能不能看到它怎么推出来的)、成本。每个场景的判断在下面。
测试 1:香港 IPO 招股书解析
第一个测试是最乱的那个。我挑了今年队列里一个 18C 章的科技公司——一只自动驾驶的名字——把英文版招股书 PDF 上传,大概 412 页。
我实际用的 prompt 是:「这是 [redacted] 的 18C 章招股书。我是个散户在考虑认购。提取(1)pre-money 估值,并与上一轮私募融资对比,(2)基石投资者名单与禁售期,(3)任何不寻常的风险因素措辞,(4)现金消耗速度和续航时间。请引用页码。」
ChatGPT(GPT-4o,文件上传): 基石名单提取正确,速度快——大概 90 秒出结果。估值那一段错了一轮——它把 D 轮和 E 轮混在一起,如果我没有交叉验证,这是一个会误导决策的错。页码引用大概覆盖了一半的论点,另一半它就直接陈述了。
Claude(Sonnet 4.5,文件上传): 慢一些,第一遍大概三分钟。但估值对账是正确的,而且我让它把基石禁售期和 2025 年某只可比公司做对比时,它真的重新读了相关页面,没有靠记忆瞎猜。风险因素那块是出乎我意料的——它从法律披露里翻出了一句关于「L4 自动驾驶牌照在内地仍处于持续审批中」的措辞,我自己读那一遍是漏掉的。那句话后来在上市当天被市场拿来发酵了。
我在两周里又跑了另外三份招股书来确认这不是偶然。规律是一致的。长 PDF 的准确度,特别是法律语言,Claude 更稳;ChatGPT 更快但我抓到它在引用上偷工减料。
招股书实际怎么读的过程,我在 Hong Kong IPO 2026 散户实战手记 里有完整流程,18C 章的具体规则在 18C 章特专科技 IPO 指南 里。我让 AI 找的东西就是这两篇里定义出来的。
这个场景我的判断:Claude。 不是小幅领先。
测试 2:股息股 DCF 建模
这个测试我本来就预期 ChatGPT 会赢,结果确实是。
我让两个工具各自对一只香港蓝筹股息股建一个折现现金流模型——这只股票我在 LRTS 香港蓝筹股息股收益率排名 里跟踪过。我提供了过去五年的股息历史(这数据是我自己整理的,不是它们的),我自己设定的折现率(8.5%),终值增长假设(2.0%)。我要求每股公允价值,外加一张 1.5% 到 3.0% 终值增长的敏感性表。
ChatGPT(GPT-4o,代码解释器开启): 用 Python 写了 DCF,跑出来,返回每股公允价值 HKD 78.40,外加一张干净的 6×6 敏感性表。我能看到代码、重跑、改假设。大概 40 秒。
Claude(Sonnet 4.5): 基本上是在脑子里算的。用文字一步一步推导,返回每股公允价值 HKD 79.10。敏感性表是 Markdown 表格,不是可以重跑的工件。打字打得慢一些,大概两分钟。
两个差不到 HKD 1,这个是让我放心的部分。但审计轨迹比答案重要。用 ChatGPT 我能把折现率改成 9.0% 然后重跑;用 Claude 我得重写 prompt 再相信它。如果我要把假设变上五六次做敏感性分析,代码解释器那个循环就是赢的工作流。
提醒一句:两个我都用自己的 Excel 模型交叉验证过。两个标题数字都对。AI 安静地出错的地方一般在税务假设——香港股息税本地是 0%,但港人持有美股股息会触发 IRS 30% 预扣(或通过某些券商用 W-8BEN 路由变成 10%),这两个我都见过它们偶尔忘记应用。这部分我在 港股股息税预扣指南 和 港人投资美股股息税指南 里都写过。
这个场景我的判断:ChatGPT,是赢在工作流,不是赢在准确度。
测试 3:券商费用对比推理
这个测试本来应该是简单题。结果它暴露了两个工具在面对模糊标准时的不同处理方式。
我问两边:「我是港股散户,年度交易额大约 HKD 50 万,分布在港股、美股和港股 IPO 认购(包含孖展)。请对比富途、moomoo、Tiger Brokers HK、IBKR、汇丰 SecuritiesDirect,从(a)单笔交易成本、(b)港股 IPO 孖展利率、(c)美元换汇汇差、(d)托管费处理 四个维度比较。给一个推荐。」
ChatGPT: 大概 60 秒给了推荐(富途,moomoo 备选)。单笔费用数字接近当前但看起来过期了大概六个月。其中一家券商的孖展利率明显是错的——它把一个促销利率当成常规利率引用。
Claude: 慢一些,大概两分钟。它没有直接给推荐,而是先反问了我三个澄清问题:HKD 50 万里 IPO 和二级市场的比例、是否能接受海外托管设置、是否在意 ETF 覆盖范围。我回答之后,推荐回来变成「富途或 IBKR,取决于 IPO/二级比例」,理由写得明确。单笔费用数字也有些陈旧,但大致是同一时点的。
两个工具的费用原始数字都不够新,不能信。我都会用自己的 香港券商对比 和 港股 IPO 新手最佳券商 两篇做交叉,那两篇我用一手数据源在更新。
两个 AI 在这里的差别是风格。ChatGPT 很快丢一个答案给我;Claude 让我先把问题想清楚才给我答案。这是好事还是烦人事,取决于你要干什么。如果只是粗略对一下感觉,ChatGPT 的节奏没问题。如果是要押钱的决策,我宁愿被 Claude 的澄清问题拖一下节奏。
这个场景我的判断:Claude,主要因为它会反问澄清问题这个习惯。 我把这个算成准确度,不算成烦人。
测试 4:HKMA 稳定币法规解析
这个测试是我最在意幻觉风险的那个。
HKMA 稳定币条例今年正式生效,发牌框架对所有碰港币稳定币产品的机构都有影响。我把官方 HKMA 咨询文件(约 80 页,英文)上传给两个工具,问:「持牌稳定币发行人的最低资本要求是多少?储备资产构成规则是什么?是否有任何法币计价的稳定币豁免本制度?请引用条款。」
ChatGPT: 答得很自信。HKD 2500 万最低资本——正确。100% 储备在高质量流动资产里——精神上对,但合资格资产清单写错了(它把公司债算进去,而这一制度的储备池里只接受港币计价的短期主权和央行资产,不接受公司债)。它没有引用条款编号;我让它补的时候,给的那个编号对不上原文。
Claude: 慢一些,更谨慎。HKD 2500 万确认,引用的条款编号是对的。储备构成的回答正确且保守——它明确说:「我在合资格清单里看到的是港币计价的短期主权和央行资产;草案版本里没有看到公司债。」豁免那一题,它指出存在模糊地带,没有编造确定性。
这个测试决定了我后面怎么用这两个工具。专门做香港监管类工作,Claude 的幻觉风险更低。 如果我当时把 ChatGPT 那个自信但错的合资格资产清单引到读者面前,那就是真的会出事。
我自己一直把 HKMA 稳定币监管指南 当工作底稿,现在我会把任何 AI 输出在发表之前都和这篇对一下。
每个场景的判断
下面这张表是我自己每天用来决定打开哪个工具做哪件事的表。
| 使用场景 | Claude (Sonnet 4.5) | ChatGPT (GPT-4o) | 港股分析师更适合 |
|---|---|---|---|
| 港股 IPO 招股书(300+ 页 PDF) | 法律语言准确度更高;页码引用稳 | 更快但引用偷工减料;混淆融资轮次 | Claude |
| 股息 DCF / 可重跑模型 | 文字推导,没有可重跑工件 | Python 代码解释器;假设可干净迭代 | ChatGPT |
| 券商费用对比推理 | 推荐前会反问澄清问题 | 快速给单一推荐;把促销价当常规价 | Claude |
| HKMA 稳定币 / 监管解析 | 保守;指出模糊地带;条款引用对得上 | 自信;合资格资产清单错;编造条款编号 | Claude |
| 计算可靠性 | 简单算式没问题,无代码执行 | 代码解释器开启时极佳 | ChatGPT |
| 审计轨迹(能否看到推理) | 强 — 引用来源,展示推理步骤 | 混合 — 代码很好,文字推理有时偏浅 | Claude |
| 成本(分析师套餐) | USD 20/月(Claude Pro) | USD 20/月(ChatGPT Plus) | 持平 |
Claude 的一个真实缺点:聊天产品里没有内置代码解释器,ChatGPT 是有的。要反复迭代模型时,这是个实打实的工作流缺口。你可以把输出粘到自己的 Python 环境里跑,但那和聊天里直接来回不是一回事。
ChatGPT 的一个真实缺点:它会在不该自信的地方非常自信,而 HKMA 测试里编条款编号那个不是单次事件——我在 SFC 通函的问题上见过同样的模式。
成本分析:分析师工作流的真实开销
只订一个的话大概 USD 20/月——Claude Pro 或 ChatGPT Plus,看你押哪一个。能覆盖 80% 的分析师场景里那个工具擅长的部分。
两个都用的话,像我这样,账单大概 USD 40/月。如果再加上批量任务调用 API,重月份大概再多 USD 10–20(我自己主要用 Claude API 批量跑招股书摘要)。
对一个只管自己组合的散户,双订阅成本看起来比「免费 Google 搜索」贵很多。对一个真在做分析师级别输出、或者每周要在多个仓位上做资本决策的人,这点钱相比一次 HKD 50 万头寸的错误判断便宜得离谱。我用的就是这个框架。
这里没有联盟漏斗。两个我都付钱。开源替代(Llama 3、DeepSeek)能覆盖工作流的一部分,但港股监管语言准确度的缺口是真实存在的,我目前还没有找到一个开源权重模型能在我的具体场景里把这个缺口补上。
常见问题
Claude 和 ChatGPT 哪个更适合读香港 IPO 招股书?
在我跑过的三份招股书里,长 PDF 法律语言和引用可靠性上,Claude 明显更准。ChatGPT 更快但更容易混淆融资轮次或漏掉页码引用。
我能用 ChatGPT 做港股股息股 DCF 吗?
可以,而且这是 ChatGPT 代码解释器真的更好用的场景。你可以在一个可重跑的 Python 工件里迭代折现率和终值假设,Claude 在聊天产品里做不到。无论用哪个工具,最好用自己的模型把结果对一下。
HKMA 稳定币法规这两个工具有幻觉吗?
ChatGPT 给出过错误的合资格资产清单,让它补条款引用的时候编了一个对不上的编号。Claude 更保守,能指出模糊地带,引用的条款编号能和原文对上。专门做港股监管,幻觉风险是不对称的。
分析师级别的 AI 工作流每月多少钱?
单工具大约 USD 20/月(Claude Pro 或 ChatGPT Plus),两个都订大约 USD 40/月。加上 API 用量重月份可能到 USD 60–80。免费版两个都不够,因为上下文长度和速率限制都不足以做真实的分析师文档工作。
我应该用 AI 来做真正的投资决策吗?
不应该,而且两个工具都不会让你这么做。两个都很适合做研究和阅读加速。两个都偶尔会在港股监管和税务细节上出错。最终的资本配置决策仍然要回到一手来源,必要的话要找持牌顾问。我把 AI 输出当作需要交叉验证的初稿,从来不当作答案。
你为什么没测 Gemini 或其他模型?
我有在用 Gemini 做图像和图表抽取,但这里这四个具体场景——长 PDF 散文、监管语言、金融建模——我每周在跑的就是 Claude 和 ChatGPT。Gemini 我会用同样的四个测试单独写一篇。
方法论说明
四个测试都是当天对两个工具跑的,输入完全一样。文件上传用的是同一份 PDF。涉及数学的地方,我用自己组合工作里维护的 Excel 模型做交叉验证。我测的是 Claude Sonnet 4.5(通过 Claude Pro)和 ChatGPT GPT-4o(通过 ChatGPT Plus),截至 2026 年 5 月下旬的版本。模型版本变化很快,我描述的性格差异可能随每次发布而漂移。判断有实质性变化时我会更新这篇。
非投资建议。 这是一个分析师对 AI 工具的工作笔记,不是投资指引。AI 工具在港股监管、税务和证券细节上偶尔会有幻觉——包括我测试时的 Claude 和 ChatGPT。港股证券决策请咨询持牌顾问,并把所有监管声明对照一手来源(HKEX、HKMA、SFC)验证。任何 IPO 认购、股息股、券商对比的历史表现,均不代表未来结果。
关于作者:Jim Liu 是一个港澳两地的散户投资者。他维护 LowRiskTradeSmart(LRTS),跟踪香港 IPO 市场数据,包括本站上的 107 只 IPO 历史数据集。自 2024 年 1 月起,他亲自认购了 27 只香港 IPO,覆盖现金和孖展两种途径。