齐飞与王左的聊天记录

Since 2026-03-08

以下是手工从微信复制出来的聊天记录，可能有遗漏和署名错误等问题。聊天记录按照日期分段。 Q 是指齐飞，qfei/qifei/Qi Fei W 是指王左，Wangzuo

2026-03-08

Q: https://github.com/jazzqi/chan-trader Q: openclaw 写的 W: [强][强][强] Q: 把技术分析的书籍和资料丢给 notebook lm 蒸馏，然后再给 openclaw 写代码实现 Q: 以前的笔记也都丢给 openclaw，整理成 embeddings W: 可以搞短视频卖课了 Q: 搞个虚拟的量化基金 W: 可以啊 Q: 先试试玩 Q: 能设计成飞轮，让他自我迭代起来就行了 W: 可以参考一下这个skill和cli W: https://npmx.dev/package-code/@moonpay/cli/v/0.6.29/skills Q: 我觉得区块链交易层不重要 Q: 主要还是要有完善的基本面和技术分析、决策、自我优化的基金架构 Q: 其实就是模拟一个基金公司 Q: AI驱动的量化基金 Q: 首先有一个大的框架，类似 openclaw，然后各个Agent去分工 Q: 会有开发各种因子的程序员Agent Q: 也会有传统基金里的技术分析师、基本面分析师，审计、仓位管理 Q: 也会有董事投票之类的机制 Q: 总之，就是把整个基金用AI agent模拟 Q: 投资的未必是 crypto W: Multi agent和subagent 不用着急 Q: 先有一个大的框架，这个框架先固定下来，然后让Agent在各个因子上独立的去尝试 W: 我刚好搞了一个架构，可以尝试一下 Q: 就像 openclaw 确定，skill 各自尝试 W: 嗯 W: bash-agent.com Q: 框架是固定的，然后下层的，随时迭代 Q: 达成自迭代飞轮 W: 我想的是把coding agent的架构用到其它领域 W: 其实就是写skill Q: 对 W: 还有一个fs W: directory structure W: https://www.ycombinator.com/rfs#ai-native-hedge-funds Q: 诺奖得主警告:公司最完美的员工数量，是0 Q: 最终的效果就是不需要人再去介入，自我迭代进化的基金 W: 目标确定 W: 开始爬山 Q: 爬山？ W: 比喻 Q: 对头 W: 每个agent都是一个git 来记录 W: 一个规范的文件目录 W: 可以看log W: 合并 Q: 设计出有一个大框架，然后就像前面我说的，前期由人丢书给notebook lm，自动生成量化因子代码，后续验证评估因子效果，迭代优化，都自动化。再后来，发现量化因子也由ai自我决策。 Q: 对，每个量化因子的开发都是独立 git，就像 skill W: 整个fund就是一个git Q: 一个 mono repo W: 嗯 W: 回头meet一下 W: 你最近忙不 Q: 可以 Q: 语音呗 W: 嗯，我给你看看现在的工作 Q: 看你时间 W: 这是一个好方向，把之前的研究连起来了 W: 还有现在的东西 Q: 其实正好就是把我们的编程经验，投资经验，在华兴的所见所闻，综合起来 W: 我没啥投资经验哈 Q: 其实，投行里的所有人，本质上都是知识劳动者，大量投行新手都没有行业经验的毕业生 Q: AI很适合替代投行，特别是不需要跟人交流的量化投行 W: ai-native fund Q: 只要实现飞轮效应，我相信。应该会不错的 Q: 未来这个基金甚至可以完全跑在区块链上 Q: 投资人通过区块链入金，通过区块链获取分红 Q: 但是这个我觉得不着急 W: 先pay our bills Q: 就相当于发币了 W: agent + fs 一切决策都是透明的 Q: 靠区块链募资也不用跟人打交道 Q: fs 是啥 W: file system W: git Q: 哦哦

Q: 做起来，拉投资，用投资人的钱跑 W: 不好搞 Q: 哪方面？ W: 资质 Q: 不是 W: 自己复利肯定是最好的 Q: 不是做基金融资，是创业公司天使投资 Q: 创业公司的产品是一个 AI Powered Funds Manager Q: 所以是走天使投资的方式募钱，就像华兴alpha 的客户 W: 你是想卖agent给基金用吗 Q: 不是啊，中间为了盈利，有可能会这么做，但是终局不是这样，这样就太狭隘了 Q: 最终应该是搭建出一个自洽的、自我进化的AI飞轮式基金 W: ai巴菲特多好 W: 拿了别人的钱没那么简单的 Q: ai 巴菲特只是其中的一个量化因子 W: 不过不着急 Q: 你这么想，你做的事情其实是创造一个虚拟的公司 Q: 你在优化的是这个公司的架构 Q: 最终公司应该是自己跑起来的 Q: 我们只是 kickstarter Q: 融了钱就是全职做了 W: 你不是全职嘛 Q: 不一样 Q: 0 人公司的概念 Q: 拉投资人，烧 token，也通过投资人获取更多现实中量化基金的信息，优化架构 Q: 护城河就是烧掉的海量 token 最后蒸馏出来的 skill.md W: 但很容易抄走 Q: 首先是闭源的，其实你这么想所有的公司组织也基本都是开源的，但你不容易直接复制一个公司 Q: 其次，如果能形成飞轮效应，后来者不容易追上来，毕竟大家使用的大模型是类似的 Q: 最后可以是一个开源的跑在区块链上的基金。但那是很终局了，如果那样，也可能是一个类似于openclaw 的开源项目 Q: 或者类似 minimax deepseek 开放权重的“虚拟基金” Q: 如果从 ASI 的终局角度看，现在人类做的事情都是没有壁垒的 W: 关键这玩意得赚钱 W: 不想别的行业比如教育 Q: 先融资 W: 很难，以我们的背景 Q: 一开始不要考虑能赚钱，初期都在搭建闭环模型 Q: 我觉得可以试试 Q: 反倒是教育 W: 如果能跑起来赚到钱也不错 Q: 我觉得传统的 k12 很夕阳行业了 W: 我的意思是金融不像别的行业跑起来就行，得有收益 Q: 有收益当然重要，但关键点不是做基金，是生产“基金公司”，这个有区别 Q: 类似 meta fund，元基金？ W: 那还是有点像卖agent？ Q: 卖 agent orchestra W: 那也是卖infra了 Q: 不是，这个是竞争力和价值的体现，不必拿来卖 W: 有点远，我觉得如果我们能自己跑起来有盈利记录就会更清楚一些 Q: 盈利是随机，依靠概率和机会的 W: 没办法，任何人都能vibe一个类似的东西出来 Q: 造的就是一个，通过一些机制，能够识别和抓住机会，通过概率不断积累的机器 Q: 不太能 vibe 一个完整的 Q: 反复 vibe 蒸馏，到闭环 vibe 自蒸馏 Q: 烧更多 token vibe 出来更高维度的组织架构，所以必须融资 W: 技术上不好说 W: 蒸馏训练不是这么做的 Q: 那是个比喻 W: 我觉得要做就是自己赚钱为目标 W: 做自己的ai native fund Q: 那我感觉不太行 Q: 规模很难做上去 W: 关键烧token不会更强 W: 这个是肯定的 W: 还是要靠人的知识引导 W: 闭环进化做不到的 Q: 造闭环 W: 至少我们做不到 Q: 想办法做 W: 最终还是要证明能赚钱 Q: 逻辑上自洽 W: 闭环也要做evaluation W: 还是收益最重要 Q: agent evaluation W: 做法应该是给基金部署agent 让人来evaluate W: 然后再调模型 W: 自己跑烧token是没办法提高的 Q: 那没太大意义 Q: 那就是 SaaS W: agent没办法自己改进自己的 W: 除非你去忽悠

2026-03-12

Q: 其实就是 agent PUA agent，人类社会本质上不也是这样？ W: 但是llm和人还是不一样 Q: 飞轮本质上不就是个 function 递归吗？ W: 现在的rl 都是要人的高质量数据 Q: 只是早期阶段，未来 github 上都是 vibe 代码的时候，claude code 怎么学呢？一样的道理，递归式的 vibe 就是飞轮，就是蒸馏 W: 花很多钱雇人啊 Q: 我其实觉得人真的没有什么特别的，一个 llm，一个 world model，基本上就能实现 AGI Q: 没有雇佣很多人的，minimax 才400多人 Q: mmt 1400 多人，华为智驾 4000 多人 W: 你知道这些OpenAI这些就花很多钱去买很高质量的数据，Mini max这种就可以用它的数据来训练，这个应该是公认的。 Q: 没错呀，这不就证明了蒸馏的价值 Q: agent evaluate agent W: 蒸馏不是agent，evaluate agent, 他这个agent自己再怎么烧token，他也不会很难提高自己的。 Q: 我觉得投资还是比 LLM 容易很多的，很多 rule based，可以通过代码固化高效的实现，不需要 RL，agent evaluate agent 应该是够用的 W: 对呀，所以你最终还是要靠你的收益来说话嘛，对吧，就是你哪怕你的你真有真的A卷，自己真的提升，你最后还是要只能靠这个收益来说话，那你都是都能提高收益了，那这个东西就。可能你做的事情就很多嘛，你就那说白了，最终还是你A着一Val a着你最终还是靠这个收益来，你说实话，你说一个决策对还是不错，最终也只能靠收益来做。 Q: 做投资的时候，你只需要把代码化的东西固定下来，需要主观判断的部分，通过大模型来做 Q: Evaluate也只是改善代码和 prompt Q: 所以并不是真正做深度学习的 RL W: 你可以去改善Prompt和代码也是这个的那一种吧，也有也包括那个这方面很多人都在做的这个，但是你。说实话，这个你比如说你让Agent自己去生成一个skill等类似的研究，都表明他其实他自己心里的skill是跟人比是差很多的，基本上可能没有不会提升或者是。甚至是负面的。 Q: 但是一时间没法真的 vibe 出来做验证，先讨论逻辑上是否自洽了 Q: 现阶段 agent eval agent 肯定是不好用的，但真的好用了，机会就没了 W: 这个不是很新的研究的，你想想就是说你哪怕就是说你做好了，对吧，你要怎么去说明你做的好，那就是要做benchmark，那benchmark很明显，就比如说你做。你比如说你的data赛是比如说一些新闻啊，对吧，然后股票的信息，然后最终还是要做回测去啊，证明你的这个Agent的效果好，对吧，那这个东西肯定是有现成的研究的，你这个肯定不是什么。也不是什么很新的想法，对吧，肯定很有很多人会从去做这个语言模型，在金融方面这边的能力。 W: 包括之前那些跑实盘的那些比赛，对吧？那这都都是一个道理。那你最终还是要靠这个benchmark来说话的，你很难通过别的去说服别人。 Q: 你说的这两点，其实都可解释 W: 说白了还是得赚钱 W: 要不然就是SaaS Q: 回测和 benchmark 都是要实现的关键组件，更关键的是实现这些组件的自我迭代闭环，这个闭环能力是最重要的 Q: 实盘的人未必是一个人，可能本身就是一个组织，实盘第一的人也未必一直能实盘第一，自我闭环迭代的能力比某一次实盘第一更重要，能在长期概率上取胜 Q: 只要能把这种自我迭代的闭环跑通，从概率论上看长期一定是跑赢的 W: 嗯 Q: 其实，你从第一性原理上考虑，投行这种纯知识类的公司，终局大概就是这样的 Q: 其他纯知识类的 Know-how 类的公司，也都应该是这样，我现在只是想到投行的价值最大，所以替代投行是一个不错的机会 W: 你现在这个最大问题就是你这个想法是，但是你这个a AI native的话，对吧，你要把这个架构确认清楚到通过这个。有哪些skill，哪些价格，这个还是有很多事情要做的。 W: 其实就是比如说你把这个像像我们现在的很多做法，就就是一个get的一个template里面哪个写好哪个文件干嘛的，然后一些skill文件。直接就就可以用什么open codex啊，什么claude code什么的，就以现成的agent去跑你的任务了，就已经可以试了，那就不需要去云端再搞什么架构什么的，马上就可以开始测试了，本地。 Q: 架构先想想呗，模拟自己开一家投行 Q: 从零开始，指挥 agent 开始工作 Q: 搞一搞，尝试拉融资吧 Q: 教育未来也要大变局 W: 教育说白了这个东西，哎，就跟这个政府一样，就很变得很慢的，而且说白了，你其实没有很多钱的，没有什么钱啊，这个很多还是这个。教培的钱。 W: 你这个AI投资，要是投资或者是AI做这个投资能赚钱，那肯定是变革是最快的。 Q: 感觉社会层面还没有意识到 AI 时代快速大变局 Q: 未来几年的白领失业潮，信贷危机，供给过剩，需求不足，经济大通缩，政府干预，UBI，再通胀。。。大部分人还没有意识到 W: 大部分人用的都是免费AI呀，那免费AI什么就搜个问题呀，回答个问题没有没有跑过那种A选的任务啊，那都是几百块一个月。 Q: 你从我们聊得基于人工智能的虚拟公司角度考虑一下？未来的公司没有员工了 Q: 可大部分人，现在只是把豆包当搜索引擎、当小助手来用 Q: SaaS 不如 SaaC，Software as a Company Q: SaaS 只是 MCP 层面的一个组件，搭建更高层次的组织结构才有价值 W: https://www.ycombinator.com/rfs#ai-native-hedge-funds Q: 就是这样 Q: 2026 Spring，即使在 YC 看来也是最新的 Trending W: 也有可能变韭菜 Q: 融资，花投资人的钱 W: 难 W: 咱两的背景 Q: 融资看的是未来的现金流 W: 除非有收益 Q: 我觉得咱俩背景可以，真正长期搞量化的，可能一直在修补旧系统，未必有魄力从零搭建 AI native 的系统，即使有，他们也不会通过天使投资的方式募资，所以这个赛道做的人不会很多 Q: 你的思维还是做量化投资本身 Q: 做的事应该是搭建能自我迭代的量化投资基金 Q: 投资收益是二阶成果 W: 准备下！ W: 你在北京可以找人聊聊？ Q: 找投资人？ Q: 可以找一些人聊聊，包括以前华兴的同事，看他们有没有兴趣，我们俩拿点启动资金，全职搞 W: 你还差这点启动资金 W: [旺柴] Q: 那不更正式，更有仪式感？ Q: 你再想想，有个冷静期，有啥问题和想法先聊清晰 Q: 2. 融资策略：阶梯式混合融资在 2026 年，VC 更看重“AI 生产力增益”而非仅仅是“模型规模”。第一阶段：天使/种子轮 (架构溢价) 目标：融资 300万 - 500万美元。卖点： “投行架构的数字化协议”。强调你们不是在雇人写代码，而是在建立一套能够自动产生代码的“工厂”。投资者：寻找专注于 AI Infrastructure 或 Fintech 的 VC（如 a16z, Sequoia 的 AI 专项基金）。 W: 想多了 Q: 在美国有溢价 W: 有点naive了 Q: 中国的是pdd白菜价 Q: Gemini 说的[Onlooker] W: [捂脸] Q: 本来就是这样，meta 的 AI 程序员拿 60w $, 同等在中国也就是 100w ¥ W: 咱俩背景差太多了 Q: a16z不可能投大陆团队的 W: 别发ai了 Q: ai 内容当头脑风暴来看 W: 在调查一下 W: 找投资人聊聊 W: 我觉得肯定有在做的 W: yc能提出来肯定就有 Q: 必然有在做，但是也没有冲突 W: 融资会很难 W: 要做好准备 Q: 说说你对融资的预期 W: 基本不可能以我们的背景 W: 除非跑起来赚到钱 Q: AI 时代要啥背景？ Q: vibe coding 的门槛，还是量化算法的门槛？ Q: 我觉得 VC 愿意投的 Q: AI 确定性的机会就那么些 W: 我们的经历 Q: 你吐槽的具体点，作为反驳测试 W: 如果我们是xx基金的合伙人出来搞融资就会很容易 Q: 没意义，核心逻辑不是靠以往的基金投资业绩 Q: 各种基金投资流派本来就很多，比来比去也没意义 Q: 而且那不是融资，只是基金募资了 Q: 基金做的事情是拿钱赚钱，我们是打造 AI 原生的闭环赚钱的机器 W: 早期比较看人经历的 W: 你有认识的投资人么 Q: 打 cold call Q: 只要这个事情逻辑上自洽合理，我觉得可以找到认可的投资人 W: 可以的 W: 肯定是可以做的 W: 看决心了 W: 决心是最重要的 Q: 你可以想想国内具有 AI 背景，了解投资，在投行工作过的人，有多少？在 AI Agents 爆发的这个时间点，出来做这个事情的人，又有多少？ W: 齐总 Q: 我说拿 VC 的钱，走这个模式，也是一种自我约束，搞个小 bot，赚点钱或者亏光了，可能就结束了，本质上可能只是运气。 W: 王总 Q: 做成一个商业模式，更持久 Q: 很可能这个商业模式，恰好也是第一波完全无人化的商业模式 Q: 我们只是尝试做 kick starter W: 第一个ai驱动基金 W: [旺柴] Q: 至少是第一批吧 Q: （这个模式也能用来替换其他的纯 know how 公司 Q: 别的公司产出的是服务，我们的产出是虚拟公司，虚拟公司的二阶产物是服务/盈利 Q: 这个模式不仅仅适用于量化基金，或许可以替代掉当前大多数公司的商业模式 Q: https://www.youtube.com/watch?v=BNDx_kbzl90 Q: 看看这些 crypto KOL，策略上也都是一招鲜，每个人擅长一套交易逻辑，都能被 agent 替代 Q: 把他们的学习资料喂给AI，可以总结出来明确的 rule W: 写agents.md 就行 Q: 差不多，agents.md 本身也是根据很多资料总结出来的 Q: https://github.com/langgenius/dify https://github.com/FoundationAgents/MetaGPT https://github.com/cft0808/edict https://github.com/openclaw/openclaw W: 我给你讲一下bash-agent W: 除了openclaw都有点过时了 Q: Edict 是基于 openclaw 的 Q: https://github.com/cft0808/edict Q: github 上的这几个 ai-hedge-fund 项目和论文，都可以拿去总结 W: 嗯，你发我看看 Q: https://github.com/search?q=ai+fund&type=repositories Q: 包括你刚才投屏的那个论文 Q: 我们直接看总结好了 W: 应该先vibe一个本地demo版本去找一些feedback Q: 好主意 W: 你现在用啥agent Q: openclaw 和 deepseek W: 试试claude code 这种 W: 或者openai codex Q: 用不了 claude Q: 封我号 W: 真正能出活的 W: github copilot, opencode W: 差别很大的 Q: 给个排名 W: 遇事不决就cursor和 copilot W: 各种模型都能用 Q: 不要生成界面，现在只要出一些 script 和 skill 描述，纯文字 W: 生成什么都是 W: 差别很大 Q: 编程的需求会在后期，要写量化因子之类的 W: deepseek 早过时了 Q: 便宜量大 Q: 适合初筛数据 W: 你用kimi/minimax 都比deepseek好 Q: 贵好几倍 W: 不差这点啦 W: 比claude, gpt还是便宜很多的 W: 可以在openrouter用 Q: 都可以，现阶段还不强依赖 Q: 想我先 vibe 一些 demo，通过试错找找感觉 Q: 试错的过程中，思路应该会更清晰 Q: 再上优秀的模型做 vibe W: 我的建议就是用最强的模型试，先知道上限 Q: 上限会变的，新模型发布就就变了 Q: 精益创业 W: 多体验下 Q: 这种就是你说的老版本 agent langchain，不是 skill： https://github.com/AI-Brokers/AIBrokers/blob/main/src/agents/risk_manager.py W: 嗯,现在只需要coding agent W: 你还有做风投的connection么 Q: 我再消化消化 Q: 呃，找找总有的

2026-03-09

Q: telegram 私有 channel 里的信息也可以转发做汇总 W: 嗯，这个事情主要还是看决心 W: 目标很明确 Q: 过了冷静期再看看 Q: clawhub 又崩了 Q: Star 很多 https://github.com/virattt/ai-hedge-fund W: 嗯，昨天想找的是这个 Q: 我看了感觉一般 Q: 一个是你昨天说的架构太老，不是 fs 设计，另外一点，基本上没有自我 evaluation 闭环的能力 Q: 没办法自我进化 Q: self-improving-agent https://github.com/peterskoett/self-improving-agent/blob/master/SKILL.md Q: https://www.theblockbeats.info/flash/335116 Q: 这都能 3000w? Q: https://t.me/q_assistent_bot Q: 试试你能发消息吧？ Q: 哦哦，这个我自己的，没泄露就行[破涕为笑] Q: 搞群组 bot 多人协作 Q: 有个做投资的朋友，我下午跟她聊聊 W: 多聊聊 Q: 教育行业范式升级 W: openclaw 国内这么火 W: 感觉还是失业的人太多了 W: fomo 情绪高涨 Q: 打电话ing Q: 对啊 Q: 跟一个 mmt 的前同事聊了下，她后来去做战略投资了 Q: 现在她也想来搞 W: 她也失业了？[旺柴] Q: 我听他的意思，他现在在做好几个创业项目 W: 啥意思 Q: 她好像现在在做一个机器人的初创团队，还有一个珠宝奢饰品创业 W: 她在干啥啊 Q: 在里面帮助做融资，团队建设，招人 Q: 商业拓展 Q: 我理解是类似这样的事情 Q: 我本来还想让她直接投呢 W: 拉皮条咯 Q: 一级市场不就这点事，跟华兴之前干的差不多 W: 谁？ W: 你让帮我们搞钱多拓展一下 Q: momenta 的前同事 Q: 项目经理 Q: 国家超算互联网OpenClaw服务接入飞书、企业微信 #OpenClaw #飞书 #企业微信 Q: [旺柴] W: 我对openclaw 不感兴趣 Q: 说出你的想法 W: 我不是说过了么，代码就是一坨，没办法二次开发 W: 就是玩噱头 Q: 我知道 Q: linux 战胜 unix，也不是靠的技术领先 Q: 生态效应 + 开放 + 持续迭代，我觉得这些因素都影响最终结果，并不只是单一技术决定结果，或者说并不只是现阶段 OpenClaw 技术决定结果 W: 技术我已经说了，生态就是skill Q: 那就无所谓 Q: OpenClaw 不行，会有替代 OpenClaw 的东西出现，再不行也可以定制出来一个 OpenClaw W: openclaw最早就是从手机去控制claude code Q: 这个无论是 OpenClaw 还是 Codex，Cursor，Claude Code，都是可以的 W: 我不是不愿意了解，我是看着它火起来的，我只是说不要追热度 Q: 核心是积累下来的 SKILL W: 不是 W: 核心是 context engineering Q: 对，协同 context W: 我建议你都试试，创业者一定要用最强的工具和模型 Q: 不矛盾 Q: 融一笔钱，让你任意烧 W: 烧不了多少钱 Q: 你就说拿到钱，在合理的成本下，能不能烧出来？ Q: 烧不了多少钱，那不更好 Q: 逻辑上没有问题啊 W: 做产品不难，烧token能烧都少钱 W: 关键还是怎么赚钱 Q: 基金赚钱是“概率”的事情 Q: 我们的目标是提高这个“概率” W: 公司要有模式 Q: 闭环自主提高“概率” W: 现在聊Ai的项目肯定都fomo Q: 你听说过凯利公式没？ W: 还是要先把directory structure 就是 context 理清楚 Q: 你看看凯利公式，赚钱就是纯“概率” https://zh.wikipedia.org/zh-sg/凱利公式 Q: 跟 polymarket 猜输赢的原理一样 Q: 盈亏比 + 胜率 + 凯利公式 W: 嗯，我说的是公司的product market fit Q: 目标用户很多可能，本质上是如果你能造出一个印钞机，你不可能缺少用户 W: 还是要落地一点 Q: 落地一步步来，先设计一个 MVP。我目前的想法是做出一个，可以 builder agent 可以自己搭建因子，并且成功设计出两三个量化因子和宏观因子，并且有一定自我 improve 的架子，再加上 risk management 等 middle office 的 agent。 Q: openclaw 的爆火，对我们是好事 W: 是的 Q: codex，claude code，cursor，你推荐的还有啥来着 W: github copilot opencode 都支持skill W: https://skills.sh/ Q: [OK] 我先玩玩 W: 我觉得目前来看架构路线都挺清楚了，做demo不难，还是要有个roadmap看看怎么搞钱把公司运作起来 Q: 当然了，To Be Done W: 齐总咋这么久突然想起来创业了 Q: 这个模式能想通 Q: 比手撸一个量化基金靠谱 W: 我以為你退休了 Q: gap Q: 还有啥好玩的 awesome list Q: B/S 公式： https://zh.wikipedia.org/wiki/布莱克-舒尔斯模型 Q: 据说高盛的面试题就是让人手推 BS 公式，一般没有人能做到第二步，这玩意丢给 claude code，分分钟就实现了 Q: 爱德华·索普，这个人我觉得你一定要看看，量化基金的祖师爷 W: 开会吧 Q: 对，昨天开始有点能感觉到了 Q: 我负载均衡里接了几十个 Cloudlflare CDN 做反代伪装，之前很稳，现在开始偶尔丢包 W: cf 都是固定的 Q: 可以指定CDN的边缘节点 W: 哪个服务怎么指定的 Q: 优选 IP W: 哪有这种服务 Q: hack 用法，又不是正式服务 https://www.vpsjxw.com/vps_use/cloudflare_select_ip/ Q: CDN 还能指定 IP，不可能是正常的需求翻墙的特殊用法 W: 怪不得 W: cf如果走香港节点就用不了大部分ai服务 W: 我一直没想到办法 Q: 你的CF为什么会走香港节点？ Q: 你说CDN还是什么？ W: worker都会自动走的 W: 用户在香港的话 Q: 你是想 worker 直接 > openai api? Q: 中间不中转一次？ W: 为啥要中转 W: 全世界就那么几个地方 W: 其实一开始是不需要的 Q: 因为hk要翻墙才能支持[Onlooker] Q: 而且 openai/claude 会不会因为 IP 太多封账号？ Q: 实际上我中转一次都不够，我的 ISP 主机 IP，经常会被认为是 spam，让我输入验证码，所以我又套了一层 wrap，搞成 ipv6 原生地址，才不跳验证码 W: 你要买专业的服务 W: 都是走家用ip Q: 好的 IP 也要买 Q: 家用无所谓了 W: 家用ip最稳定 W: 都是直接入户的 W: 薅ISP羊毛 Q: 我这个 4美元一个月 Q: 最低配了 Q: 我感觉投资人比我们更 fomo W: 冲一波 Q: 冲啊 Q: openclaw 还是挺脆弱的 Q: 手动管理 session。。。 Q: cron 任务污染了我的 main agent session

2026-03-10

Q: 搞了个 HR，接需求生成员工 skill Q: https://www.terminaluse.com/ W: 我好像能装claude code，不知道会不会封号 W: 那你就用opencode W: opencode + openrouter Q: 我看看 W: 或者和我一样就copilot Q: 有啥区别啊 W: copilot 订阅很多模型都有，还可以连opencode Q: [OK] W: 而且比较稳定，毕竟azure W: 也就是10刀 Q: 为啥 cc 这么火出圈 Q: 如果模型能力一样，岂不是没有太大差别 W: 最早做的 Q: 有个想法感觉可以引入价值观倾向 Q: 左派右派倾向 Q: 进取与务实 W: 其实就是个prompt template W: 然后变成一个directory structure Q: 是的，就是通过prompt尽可能描述一个完整的商业组织 W: 一个是structure，一个是我workflow W: 即使是 autonomous agents 也没把有办法像人一样组合在一起，还是要有pipeline/workflow W: 总要有trigger, runtime这些概念 Q: ACP 是干这个的吗 W: 不是 Q: cron timeout loop while for 等等，用这些模拟公司运行 W: 其实就是什么时候react W: react -> call llm W: 现在的mulitagent 其实很多就是subagent，不是autonomous W: autonomous太复杂了 Q: 我觉得不能大规模用 sub，小团队小任务可以 sub Q: 就像公司的组织架构一样，扁平化可能会更好？ W: 先跑一个或者几个pipeline W: 相应不同任务 Q: 我先试着看自己看能搞出来一个不 W: 嗯，先写文档 W: 我建议不要让AI生成一堆，哪怕自己写的很乱，再用ai 改进 Q: 我现在有一个文档，各种各样的点子我都先汇总起来 Q: AI生成了一堆，太多了，保存起来很难管理 W: 容易 slop 分散注意力 Q: 我今天有个想法，让AI设计一套文档架构，就是保存我们讨论的思路 W: 要删减一下 Q: 我把前两天的聊天记录一条一条复制到文档里了。拿给AI总结 Q: 复制的手都麻了 W: agent orchestration 你可以看看 Q: OK W: 但是我觉得还是从几个小任务入手 W: 每个任务就是一个skill W: 然后每个任务都输出记录到fs，就可以拼起来了 Q: 其实我的想法是从顶层去出发，Agent自己去招募下级Agent Q: CEO去招聘CTO、CTO组建团队，CEO制定目标，CTO设计方案，团队分工实现 W: https://x.com/arscontexta/status/2026492755430474002 Q: 对，其实skill也就是在干这个事情 Q: context engineering, or maybe auto context engineering Q: Agentic Context Engineering , Plan-Aware Automated Agent Context Engineering Q: 我感觉我就在不断地，发散 > 收敛 > 发散 > 收敛。今天尝试收敛起来。 Q: AI 的 context 不够用会混乱，人也是 W: 所以要用agent去跑特定具体的任务 W: 知道局限在哪 Q: 我把想法收敛起来，你来搭 “hello world” agent 的架子？ Q: 按照你对行业最佳实践的理解，搭建一个 State-of-the-Art 的 boilerplate W: 就是一个git W: 然后跑现成最好的coding agent W: 不会比这更好的了 W: 所有都fs化 skill化 Q: 可以 W: 我现在做agent都是这个路子 W: 先不考虑云端服务器什么的 W: 能干活再说 Q: https://mp.weixin.qq.com/s/yasp_N840roIfH5b-LPXHQ?scene=1 W: dify 现在热度下降了很多 Q: 你感觉是为啥？ W: 不需要这种流程了 W: 就像写代码不需要编辑器 Q: 成 SaaS 炮灰了 Q: 感觉是抽象度不够高 W: cursor 都有点崩了 W: 所以我觉得fs + skill 是可以直接从模型能力提升中受益的 W: 就是你什么都不做，gpt-5.4 切到 gpt-6 ，你的产品就更强了 Q: 当然啦 W: 做Ai产品一定要以这个为目标 Q: 一个 Agent 是 AGI，一大群 Agent 协作就是 ASI Q: 直到有一天 Model 的 context 达到，足以同时支持一大群 Agent Context，那就是 ASI Native 的时代了。人也不需要做什么了。 W: https://x.com/odysseus0z/status/2030416758138634583 W: just in time Q: 是这个意思 Q: 但不知是编程领域 Q: 现在的人类和五千年的人类从基因生物学上看没区别，但是组织结构的优化，使得同样智商的人创造了远远超出以往的价值 Q: 从大航海时代，诞生了商业公司这种概念，伴随着就是科技革命，相辅相成 W: Skill 真是耗token W: 最近github copilot 可能更新了，加上gpt 5.4 啰里八嗦 W: 好多任务都跑不完 W: opencode 就比较稳定了 Q: 让 agent 学习金字塔模型，提高沟通效率[Smirk] W: 你想的太美好了 Q: 总要乐观，一点点迭代呗 W: 所以要具体的任务，特别是我们有能力判断Ai做的好不好的任务 W: 然后再开始迭代 W: top to bottom 我觉得目前还不行 Q: 监督学习 to 无监督学习 W: 自监督 W: 哈哈 Q: bingo Q: 试试吧，learn by doing W: 我觉得“每个人的基金管理团队” 这个概念不错 W: 前期比较好理解 Q: 也可能就是我们自己的基金 Q: 总之，产出的是一个“基金机构” W: 可能要crypto first Q: 往大了拓展，也可以生产别的类型的公司 Q: Crypto我觉得肯定是很重要的一部分 W: 👌 W: 类似回测 Q: 没错，回测也是最容易 evalutate 的，应该比较容易实现自监督 Q: 咱们换到 telegram 聊吧，搞个 group，我更容易导出聊天记录，做总结[Lol] Q: https://t.me/+CmxUSDr3LehmMjY1 W: [good] Q: 张小龙不封他？ChatGPT刚出来的时候，我搞了一个通过网页版微信逆向工程接入GPT API的工具，用了大概两三天，就被微信警告了。后来我的账号甚至都不能登网页版的微信 W: 嗯别乱试 Q: 歪个楼，我觉得未来关于真人身份验证也有很大的机会 Q: AI 时代的 CAPTCHA Q: 小红书发布公告:将严格打击AI托管类账号 W: 肯定会有一些反AI社区 W: 真人交流 Q: 不介入物理世界，应该很难实现。图灵测试已经失效了。 W: 主要是成本和规模 Q: 扫描虹膜吧 W: 交友网站其实已经在做验证这个事情 Q: 我感觉很难实现 W: 你搜一个大超说媒 W: 相亲要验资面试 W: 挺有意思 Q: 说白了还是要依赖外部验证，而且银行截图也不可靠，AI 能模仿 W: 就是成本和规模 W: 但是我觉得这种真人场景需求不会太大 W: 不如断网回归现实 W: 你也是币圈的人吗 [旺柴] Q: 我确实是 fomo 的人 Q: AI 革命前的萧条 Q: 高收入白领失业，又没有UBI，攻击端过剩，但是需求端垮了 Q: 这个叙事解释最近美股崩盘 Q: 供给端* W: 你都躺平了fomo个啥 Q: 乐观主义者就会 fomo Q: Meta 收购 AI 社交网络平台 Moltbook。（AXIOS） W: meta fomo 了 Q: 哈哈哈🤣 Q: 我当时买了点 WLD，太鸡贼了[破涕为笑] W: 给我github Q: github organization invite 你了 W: ok W: 2049? Q: 防止重命名临时起的，建国 100 年[Doge]，也是银翼杀手 2049 的年份，人造人跟人类已经很难分清了 W: https://github.com/ACE-2049/fund Q: hello world Q: nb W: 1. task -> skill -> orchestration 2. role -> team -> company Q: 你先发挥来一版 W: 你先定义一些简单的task和流程 W: 我来测试一下 Q: 所以 fund repo 里面只有一个 agent？ W: 可以分目录 Q: 在 root 下分 agent workspace folder？ Q: 你再加一个 HR 的空 agent Q: 我补充内容 W: 可以试试 Q: 我对 fs 组织方式还不熟 Q: 昨天看了一部分，又忘了点 Q: 先手工搞下，然后 copilot 了 W: 这玩意现在没有最佳实践 Q: 明白了 W: 随便搞 W: 主要是看效果 W: 再迭代 W: 你就别想agent W: 想怎么让一个公司所有人高效分享数据 Q: HR 就是个中间层啊，要跟上下游沟通！ Q: 本技能让HR Agent在完全AI原生的公司中自主完成从需求收集到技能定义的全链路招聘闭环。主要价值： - 消除人类HR与部门间反复确认的低效沟通 - 用结构化、标准化的方式让用人Agent（部门/项目Agent）一次性讲清楚真实需求 - 输出高质量、可直接发布的招聘文案 + 候选人画像 + 技能清单 - 为未来招聘的AI人才预留“技能即插即用”设计（输出的技能可直接转为Agent Skill）当以下任一情况发生时，应主动激活本技能： - 收到来自其他Agent的招聘请求消息 - 系统检测到团队算力/角色缺口告警 - 项目Agent提出新增协作角色需求 - 高层Agent下达人才扩张指令 W: 这种大概率没用 Q: 试试，让 Agent 生成 skill W: 可以参考那个ai-hedge-fund W: 还是要以data和流程为主，role 只是呈现，做demo用的 W: 看起来比较fancy Q: 我设想的一个demo方式就是把那个AI h fund的架构图喂给主Agent，让Agent自动生成一整套agents skill W: 可以先看看它那个怎么做 orchestration Q: 短期从投资收益的角度看效果，肯定是你说的方式最好了，但是有一个问题是，这样我们就是从一个中间切面开始的，向下扩展优化是比较自然的，但是向上扩展很反直觉？ W: 只要是fs based 我觉得问题都不打 Q: 可以 W: 你别管什么role，只要整个company run on fs Q: 反正是先 playground W: 先不要用ai生成一堆 W: 没意义的 Q: 我就在 AI 生成。。

2026-03-11

W: 没意义的 W: 只有跑起来能看到效果才有意义 Q: push 了 Q: 你先瞟一眼，明天再加 W: 我不会看这些的 W: slop W: 你就简单列一个文档就行，我给你一个例子 W: 这是一个ai 自动写paper的workspace定义，就有一个这种文档我们一起编辑就行，不要用AI去写， Q: 懂了 W: 文件的目录和每个目录的文件，结构 W: 这个要放到AGENTS.md 里面 W: 属于最高级别的指令 W: 你不用创建一堆目录，AI只要这个指令自己可以去创建相应的目录 Q: agent.md 文件放那 W: 先放root W: https://agents.md/ 这个 W: claude 叫 CLAUDE.md Q: 这个太微观了，看上去就是针对码农专用的 W: 不是 W: 这个相当于system message，只不过放到文件里面了 Q: 我看看再理解一下 W: 上层再怎么花哨，落实到底层也就是一个llm api call Q: 那是 W: 逃不掉的，你不要想着把agent角色写好，所有东西就跑起来了 Q: 尽可能把每一个 context 构造完美 W: 那种东西可能就是一个openclaw群聊小组了，除了烧token做不了啥 Q: 明天在搞，先睡吧 W: ceo 不是一个skill Q: 这块我还没有搞特别清楚，agents里面定义的维度到底是 skill 能力，还是各个 agent，也就是说 skills grouped by agent W: 你就想agent 拿到这些skill 定义能不能干好活 W: find-news 就是一个很具体的skill Q: 所以这个Agents虽然是plural，但是里定义的是一个Agent？ Q: 有没有办法在这个定义层面就把多个Agent隔离开，Skills能力独立配置，不要共享 context W: agent orchestration 是架构，和这个没有关系的 W: 这些都是prompt W: 我一直都让你不要想架构，什么ceo, hr 这种 W: 现在的agent设计还没到那个地步 W: 先想有哪些任务，大部分时候都不需要multi agent，大部分multi agent 也只是看起来fancy Q: 但是这些任务其实本来就是现成的，他应该是被组织架构去推导出来的 Q: 你要做量化用的那些因子，不应该由我们直接决定，应该是一个从上到下推导出来的过程 Q: 哪怕是直接从最上层下了一个命令，比如告诉 CEO 说一定要做某一个量化因子，比如分析热点新闻+流行叙事，筛选热点，自动投资 meme W: 分析热点新闻+流行叙事，筛选热点，自动投资 meme W: 这些就是 skill Q: 没错，但是这个skill不应该由我们来手写 W: 这个得人来写 Q: 应该是让CEO去拆解划分底下实现 Q: 我觉得哪怕是我们把实现思路告诉CEO，然后CEO再通过组织协同去自行实现都可以，要好过我们自己写这些 skill W: 那只能slop了 Q: 咱们不应该作为一个 vibe coding的角色，而是推到下一层 agent 做 vibe coding Q: 人创造的绝大部分信息也都是 slop，AGI 来了，agent 会笑话 UGC 内容才是 slop W: 做demo没有问题 W: 可以先看看效果 Q: 模型能力提升肯定会解决 slop 问题，stable diffusion 刚出出来的时候生成的图片手指都很异常，这不就是明显的slop，但现在手指 slop 问题都解决了 W: 不一样的 Q: https://mp.weixin.qq.com/s/tHkEmHb4XJygmKaOBofjug?scene=1 W: 模型提升的手段相当于手写skill Q: 可以通过公司组织结构，优化 slop，就像人类对抗平庸之恶 W: 模型的能力就是average W: 无解的 W: 你试试嘛 W: ai就是实验科学 Q: 能力是平庸的，但是通过分割的context，可以实现专业分工 W: 反正都是vibe，也不用很多时间 Q: 每个初始模型其实都是刚毕业的大学生，但是入职后，公司按照 job title 做入职培训，给他们各自专业所需的相关资料，让他们去适应各自的职位 Q: 你说让我试试啥？ W: 你按照你的想法vibe试试 Q: [好的] Q: 其实你看看川普政府，国防部长，谈判专家，很多都是业余的，从来没在政府里工作过 Q: 本质上不就是一大群 Average Agent + 行业 context W: 不一样的 Q: 他们提供信息给川普，川普根据信息做决定，在指导他们去 vibe Q: 为啥很多人吐槽川普政府是草台班子 Q: 世界就是个巨大的草台班子 W: 草台班子那是因为有前人搭的班子 Q: 这些Agent就是班子，把他们组织起来，就是草台班子 Q: 川普为什么敢把从来没经验的人提到那么高位置 W: demo肯定没问题，主要还是看怎么叙事去融资 W: 因为懂技术搞研究的人会觉得这个做法没有太大价值，太多这种项目了 Q: 其实从现在美股 SaaS 崩塌，可以看到未来单纯服务型的商业模式已经没有价值了，单纯的服务是很容易被替代的，只有说你提供的是一个可以自己净化的服务，也就说像公司一样的组织架构，我觉得才有生命力 Q: 你看，如果单独定义一个Agent，给他设置一大堆skill，这确实是当前 vibe coding 的现状，但本质上不就是Saas 替代吗？没有护城河 Q: 因为我觉得大多数搞这种研究的人还是偏AI，你要搭建一个组织架构，需要理解商业模式和社会学 Q: 比如说，如果你只搞了一个传统公司，给他们各种简单的角色和描述，我觉得要 evolution 很久才会有效果，大多数人是等不到的 Q: 但是如果在一开始就能按照当前最优的组织设计，很可能跳过 slop 阶段 W: 你先vibe试试，多体验一下agent的工作 Q: yes Q: 你觉得是从零开始学编码做编程难，还是从零开始学vibe coding难？ Q: 如果说前者更难，AI 已经学会了前者，那么后者没道理学不会 Q: 所以，即使我们都学会了 vibe coding，后面也应该把 vibe coding 本身交给各个 agent W: 还是这个，得边做边招人聊聊 W: 对于我来说各个路线都比较清晰的，你先试试vibe demo，主要熟悉一下coding agent Q: 我聊过一个投资人，他初始的思路和你是比较类似的，希望尽快能有商业化变现的路径 W: 嗯，多聊聊 W: 如果能先帮我们自己赚钱，我们自己先用上也不错的 Q: 但是我给他讲我的思路，包括当前 SaaS行业的变局，还有梁文锋的商业模式等等，他们还是挺兴奋的 W: 嗯，要看人，文科生比较吃这一套 Q: [奸笑]这个有很大的问题 Q: 万一你一笔挣个大的，退休了怎么办 Q: 给你一个小目标，你退休吗 W: 想多了 Q: 很真实的问题，我面对过 W: 那你给我吧 W: fund 我 Q: 哎呀，不用diss文科生，文理结合推动世界发展[奸笑] Q: 没有了啊 Q: 但我觉得未来你肯定也会面对这个问题，到底要不要退休 Q: 我当时是又吭哧吭哧写了几年代码 W: 没有，确实现在文科生更fomo W: wtf W: [裂开] Q: 所以要搞一个长长久久的模式 Q: 只有飞轮式闭环才能长久 Q: 如果单纯依靠我们俩，或者任何一个人，都不长久 Q: 我们就应该成为Kickstarter，后面让这些组织自己去进化 Q: 我们最好一开始就能把组织架构设计得完美一些，减少前期无意义的slop W: 先迭代吧 Q: 只要模型能力还在继续提升，我们及就是什么都不做，slop 也会自己减少 Q: 我们肯定是先迭代，day 1 做不出来闭环，day 30 有个雏形，day 100 完整跑起来，应该就能放开了让这个闭环自己跑着看 W: 这个是对的，但是能不能做到 self improvement 还要看 Q: 我相信一定会的，从第一性原理上看 Q: 这几天我在试试Copilot Q: 给我点时间，我还得再熟悉熟悉 vibe coding Q: 我写代码的时候还没有这玩意儿 W: 是，先熟悉一下工具 W: 以出东西为目标熟悉就很快 W: 我帮你看看 Q: 你有建议没有，或者我先看几个youtube W: 直接上 Q: 正在让copilot给我创建 git，写 commit 呢 Q: 说实话，我看了一下现在的 gitlens 生成的 commit msg，感觉我以前写的 commit msg 都是泔水 W: https://x.com/ashpreetbedi/status/2031416367610744960 W: 减少心智负担 Q: 没错，向量数据库适用于单个 agent 的 context 优化，积累自己的 memory；多 context agent 就是我们说的通过 AGI 协作实现 ASI 的思路。 W: rag 总感觉不对 W: 就是效率还有一些优势 Q: RAG只是单人知识管理 W: rag便宜 Q: 还是可以用 RAG 用来提升单 agent context 效率 Q: 要用 RAG 的 W: 不需要的 W: 咱又不做saas Q: 虽然多 agent 模式拆分了整体 context，但是单一职责的 Agent memory 如果太多了，也许要 rag 优化吧 Q: 我觉得跟做不做 saas 不矛盾，RAG是在单个Agent层面的优化 Q: Agent Orchestration Context + RAG Q: 组织层面 + 个人层面 W: rag主要还是效率 W: 比fs快 Q: 先做FS，太膨胀了再加 RAG，非必要 W: 和单人不单人没有关系 W: 这个技术而已 Q: 如果 orchestration 拆分了 context，实际数量很小，fs 足够了，就没必要 rag Q: context 拆分后依然过于庞大，再 rag W: fs也可以read lines W: rag基本上已经被抛弃了 W: 主要技术上复杂了 W: 做法不够ai Q: grep 呗？没人用就不用，context 大小合理就行 W: 这个东西就是为了效率啊，你用向量数据或者是搜索引擎去搜，那它的效率肯定是比这个A去在loop里面跑边跑边读要快很多。但是他需要你要引入很多依赖，那你现在不用去担心这些，就我说的，你就在那个你用现成的这个coding coding agent去跑就好了，然后可能最多加一些什么browser tool这种浏览器的这些。工具比较实用一点的工具就好了。 Q: 这么说，感觉抽象度还是越来越高了，RAG 还是太具体了，纯文本没必要在优化成向量空间了 W: 同意，是这样 Q: 你你说的很对，这个东西就是无论是什么向量数据库啊，还是什么知识图谱，这些东西最大的问题，它就是你作为人啊，很难去知道一个向量数据库好不好，或者是一个知识图谱构建的好不好。你唯一能做的就是用你的数据库去做benchmark，那这样的话其实非常的不，A native. 那你一个文档写的好不好，人一眼就能看得出来的，其实很多时候。对吧，所以这个做法其实是很合理的。 Q: 其实我觉得可能还是模型的能力进步了，向量数据库和文本相比，性能成本优势越来越不明显，但就像你刚才说的，RAG的劣势很明显，人类没有办法理解，所以在绝大多数的场景下，就淘汰了 W: rag便宜 W: 快 W: 要做to c就没办法 Q: 成自行车的辅助小轮了 W: rag产品好多都凉了 W: 不赚钱 W: 任务太简单 Q: 嗯，其实我觉得完全不是，我可以告诉你一个投资哲学，在AI时代，越早有商业化收入的模式，越早会被淘汰 Q: SaaS 就是前车之鉴 Q: 做任何一个行业的Agent，都不会有技术壁垒 Q: 有商业化收入的商业模式，很快都会陷入竞争性毁灭的模型 W: 比不过manus这种框框干活的 Q: 前浪死在沙滩上 W: 你别管对不对，看在AI这么努力的份上都很专业 W: true Q: 也许哪一天通用模型达到了ASI 的效果，只要跟他说，我有一笔钱投给你，你按照最顶尖基金公司的模式来管理，他就能做到。那我们就也是前浪了可以彻底躺平了。[破涕为笑] Q: 有个美剧同乐者，你看过没有？ Q: 我觉得剧里面就很像ASI时代，当然是比较黑暗、荒诞的版本 W: 不好说啊，所有人都有AI Q: 人类都歇菜了呀，成被 AI 保护的动物了 Q: 人类自己造了个硅基版本上帝 W: 别想这么多 Q: 那就是最终极场景嘛，我觉得在那天之前，我们的商业模式都是有价值的 W: 先给我一个小目标 W: [旺柴] Q: 第一个跑起来的基金就叫 Z Fund 吧 Q: Z Fund is the Ultimate Fund，目标是人类的最后一个基金，因为再往后人类就不要货币了[破涕为笑] Q: 歪个楼，我想起来，当年我们在华兴做的，其实就是一个投行定制版的飞书，但是我们那几个人团队的体量不足以支撑起来，飞书这么庞大完善的平台 W: 现在去做肯定不一样 W: Alverify的结果还是要人类verify的，因为LLM的review结果里会有很多falsepositive和false negative的......毕竟 LLM本质上就不是一个靠谱的东西......多轮长对话迭代也不一定会收敛，或者不一定会收敛到正确答案。很多行外人是不理解的......//@热干面塑料袋:有道理，换个AI来verify。。。。.收起 @agentzh 我们已经进入垃圾代码批量制造的时代。老话说，尽信书不如无书。现在尽信AI也不如无Al了。其实用好AI应该像里根总统说的对待前苏联那样:"trust,but verify"。 Q: 这个人说的只是是现状而已，他觉得模型不如人靠谱呗，但实际上很多人也是不靠谱的，永远依赖一个 100% 靠谱的 key person 是不现实的，比如公司里的大牛走了，公司剩下码农的依然要想办法改代码啊 Q: 昨天的 claude code review 就是 evaluate 程序员工作的： https://claude.com/blog/code-review Q: 他说的本质上还是 slop 的问题 W: 训练方式决定的 Q: 随着模型能力改善，slop 一定会逐渐消失，剩下的只有人类的“泔水” Q: 人类拿不准的时候，也会扯皮，也会瞎猜 W: rag 有一个好的地方我忘了说 W: multimodal W: 图片视频embedding Q: 啊对，我们开始应该很少有场景用多模态，需要再加 W: 更多还是 embedding W: 不是rag W: 不过有一种multimodal rag Q: 比如 skill：扫描 youtube KOL 的视频/直播，实时从字幕和音频中识别的信息，必要时自动从实时图像帧里提取关键信息，然后统一汇总？ W: 这个要用computer use W: 或者一个workflow 去下载script Q: ytb-dl 啥的 W: 差不多 Q: 配合 ffmpeg，ai 自动多模态提取图像信息，肯定能做 Q: 哈哈，我感觉我们讨论的这些技术问题，其实应该让Agent来想办法[捂脸] Q: 咱俩应该是 infra builder agent 的 coach 或者说顾问 W: agent 比较广泛 W: 你还是太高估了现在的agent W: 试试出活 Q: 不是高估，只是我觉得这个临界点快到了，或者说在局部已经达到了，现在来做，随着模型能力的提升，就是第一批受益的人，做的晚了就没有先发优势了 Q: 而且，要相信 orchestrated 大模型有涌现的能力 Q: 三个臭皮匠，顶个诸葛亮 W: 还是要从外部获取信息 W: 纯烧token肯定不会收敛 Q: 肯定要加外部 Q: “学习资料”、“最佳实践”、“网络信息”、youtube 视频，都是喂给 agent 的 prompt W: 他妈的币圈现在真傻逼，人家用AI提升人类工作效率，改变世界，攻克癌症呢，他妈的，BN在这里上了他妈龙虾两个字，去蹭人家热度，发币卖给韭菜，真他妈傻逼。过个春节你去蹭别人名字发个币，看到什么热点去蹭了发个币，然后上交易所卖给韭菜，怪不得Peter看到币圈的人就直接拉黑。 Q: meme 就是这 Q: meme 背后的逻辑，我也想透了，跟 polymarket 一样，概率赌场 Q: 但是最关键的不是我们去发现和理解这些投资逻辑 Q: 应该启发Agent独立区发现并追踪和验证投资逻辑 Q: 鼓励式 PUA Agents Q: Anthropic推出Claude Code的Code Review功能(目前为Team和Enterprise计划的研究预览版): .每个PR打开时，自动派遣一个多代理团队并行深度审查 W: https://proofeditor.ai/ W: Hunter Alpha is a 1 Trillion parameter + 1M token context frontier intligence model built for agentic use.It excels at long-horizonplanning,complex reasoning, and sustained multi-step task execution, with the reliability and instruction-following precision that. W: deepseek 或者 meta Q: 是基于这两个？ Q: 啥意思？ W: 一般都会匿名测试一下 Q: 大公司给测试版本穿的马甲呗 Q: 这名字听着太像量化模型了。。。 Q: https://longbridge.cn/zh-CN/news/278816292?channel=SH000001&invite-code=6E9AUK&app_id=longbridge&utm_source=longbridge_app_share&locale=zh-CN&share_track_id=79cd2e2f-10cc-4d3a-a277-9c5f71873eb1 Q: “递归式自我改进” W: 今天说了个 universal high income Q: 就是“共产主义” Q: AI 时代的乌托邦 Q: 但是这个路径在逻辑上是合理 W: 合理的，但是国内连养老金都不一样 W: 还想着ubi? Q: 国内是假的，忽悠人的 Q: 不过如果能解放思想，180°大转弯，可以实现。物理基础是有的，思想包袱太重。 Q: 每天这么多新概念、新叙事，看都看不过来，都没办法写东西了 Q: 咱们有没有办法采集所有新闻，收集新的概念和叙事，持续追踪（有记忆），筛选出来重要的、原创的叙事，跟踪其演进，在关键时刻，主动提醒我们关注 W: 这个已经是一个很完整的产品了，你可以先搜搜github Q: 没必 github，直接 vibe 出来一个 Q: 这是一个宏观量化因子 W: https://github.com/samgozman/fin-thread https://github.com/AlgoETS/AINewsTracker 参考一下 Q: 不需要 gui Q: 我大概看了一眼，但是感觉他们主要还是集中在收集总结新闻，找热点 W: 嗯 W: 先试试 Q: 缺少一个我觉得非常重要的功能，从新闻里面总结出来多条叙事，并持续追踪这些叙事的趋势 W: 用 bun + typescript 吧 W: 做成一个cli ，然后配合一个skill，让agent自己去用 Q: 新闻里的各种热点，有些昙花一现是无所谓的。但有些东西是草蛇灰线，本来毫无意义，但在某些时刻可以突然连点成线，如果采集系统有记忆，就可以实现这样的功能。然后让我们第一时间的去发现一些新的叙事！ Q: 然后我们可以再有一个Agent，根据这些叙事的持续发展做一些概率上的预测，这其实就可以是一个polymarket套利工具 W: 有这个都可以融资了 Q: 同样也可以用在 meme，预测下一个可能爆发的热点叙事，提前埋伏 meme Q: [奸笑] 你来做！ W: 我咋做啊 Q: 来吧，vibe 一个 Q: 几乎不需要任何Gui Q: focus on data understanding Q: 我自己学 vibe，达到你的理解需要时间 Q: 各种信息穿插进来，又打断我学 vibe Q: 你看你还要去刷 hack news，刷 github trends、刷各种网站 Q: 这些都是心智成本 W: 我最近动力不足 Q: 比如龙虾爆火，导致龙虾的 meme 暴涨，所有了解币圈的人，其实都应该能想到这个逻辑，但是大部分人可能因为各种琐事遗漏了，这个时候，如果有独立的Agent，缩小 context，就不会错过。 W: 毕业又失业 Q: 来融资创业吧 Q: 把 agent 当成员工，以人类商业社会的组织形态，打造出真正的 AI Native 商业模式。 W: 靠谱嘛 W: 我最近几年都burned out 了 Q: 不要再直接用 ai 造轮子了，想办法让Agent理解我们造轮子的思路，学习我们造轮子的方法，替代我们造轮子 Q: 所以我说，我们两个最终都应该尽可能少写代码，不要成为一个Key person，要实现 agent 自我递归进化 Q: 我们就能不再 burn 自己 W: 没那么简单的 Q: 说出来你的担忧 W: 要找工作了 Q: 1. 从 a/b/c/d... 网站分别采集今日新闻，按目录分类 2. 按分类目录，各自合并重复的各条新闻 3. 从各类新闻中发现叙事后跟新到叙事线索中，剩余独立事件尝试从长期记忆中找关联形成新叙事，如果依然不存在关联，将该独立事件保存到长期记忆 4. 对比当前最新的各条叙事线索，判断是否需要合并或者拆分 5. 对最终筛选出的叙事线索，进行评估分析，需要关注或者立刻行动的，发出提醒 6. 预判当前叙事线索的走势发展，如果下一步可能需要行动，发出提醒 W: 最近上不了强度了 W: 太累了 Q: 在干啥啊 W: 没有家庭我可能一个人回乡下了 Q: [Facepalm] W: 最近都没收入了 W: 要先找到工作 Q: 融资 W: 哪有这么容易 Q: 你在香港生活大概需要多少工资 Q: 搞起来了搬去新加坡好了 W: 还有毕业论文在改 W: 我哪有你这么潇洒 W: 这个月大概不行，这个事情还是要专注搞 Q: 没事儿，你先搞你的论文 Q: 我觉得没必要急在这一两天 Q: 我觉得真正在我们开始做之前，这段时间都是个冷静期 Q: 可以从各个方面去考虑，评估后再决定 W: 你是想我们两你负责融资我负责技术吧 Q: 我可以啥都干，而且初期肯定也是啥都干，但是我最终肯定没办法每个领域都 all in Q: 所以你肯定是 CTO W: 差不多 W: 先按照这个思路把roadmap计划一下 Q: 可以，就拿这个试试手 W: 你先整理下新闻源 Q: 现成的，我发给你 Q: General/Finanical * https://t.me/s/Financial_Express * https://t.me/s/jin10light * https://t.me/s/FinanceNewsDaily * https://t.me/s/scmp_zh Crypto * https://t.me/s/theblockbeats * https://t.me/s/cryptocurrency_media * https://t.me/s/ai_9684xtpa Q: 还有好多，先用这几个试试 W: ok W: 看看怎么推进这个事吧 Q: 搞个看板，或者换个有主题的协同工具吧，微信聊天 context 太分散了 Q: 我在试着配置 discord Q: tg group 不太适合 Q: 这也是我这几天考虑的事情，毕竟没有当过 PM [Facepalm] Q: https://discord.gg/wq9SThtj Q: 还用 trello 吗？ W: https://github.com/openai/symphony Q: 这个看起来很 AI Native W: 还是elixir W: 我们自己公司也文档化吧 Q: 我有个自己的，还不够结构化，考虑用 ai 整理 Q: 来 discord 吧，自动导出聊天内容，每日总结梳理，高亮重点，包括生成 roadmap 等等。 Q: 这套真人 ops 的自动化我来考虑搭建 W: ok W: 你不如直接vibe个聊天 W: trello W: sqlite 存到fs Q: 聊天出 trello 呗？ W: 让agent 直接sql去读 W: 其实有一个sqlite 项目就叫agentfs W: fs 放到sqlite Q: 等等，sqlite fs 和 trello 的关系是啥 W: vibe一个 W: 用sqlite存数据 Q: 其实我觉得用纯文本markdown输出一个看板就行 Q: 不需要人去拖动 card，只要在聊天里提到 card 的相关信息，就能自动更新 card 状态 Q: 这个trello看板就是个聊天记录的 side effect，主要作用只是给人去看当前状态的 W: 嗯 W: ai native Q: 这个连 youtube 都能总结了 https://clawhub.ai/steipete/summarize W: 有的没有自带字幕可能不行 W: 要transcript W: 奥，这个自带了 W: 你推特是啥 Q: 我现在都不发啥 Q: https://x.com/hexorcist_9000 W: 买个会员啊 Q: 有啥用 W: https://www.openui.com/ Q: 可以，当作给我们俩（人类）接入的 UI，但是最好越少越好，GUI 对 AI 来说太昂贵了，不划算 W: 有点类似 json render Q: 对的，prettier, for better human interactive Q: 但是最好是没有 UI，懒才是第一生产力，越少需要人类介入，就越成功 W: Andrew Yang suggests the US should stop taxing humans — should tax AI instead to fund UBI. Q: absolutely Q: AGI 时代，必须 UBI，ASI 时代，则是 UHI Q: cc，codex，copilot 啥的，有个很大的痛点，不能在手机上用，这点真的不如 openclaw！ W: 这就是这个openclaw的作者的初衷啊。 Q: 对啊，所以我挺喜欢 openclaw 的，我不一定带着电脑[Facepalm] W: 嗯，Github 的手机版可以用那个copilot直接开那个agent，就是你在那个给他一个request，就可以在那个手机APP里面给他了，给他让他去跑。 Q: 所以你把 skill 放在 .github 目录下是吧 W: dui Q: 👌 W: 每个agent都不一样 W: 很烦 W: 可以用skills.sh 自动装 Q: 这点不如 openclaw，持久化了，我也用 find-skill W: openclaw 用的pi agent W: 我内部有一个类似的轻量agent Q: 感觉以后能用上 W: 如果是coding agent, 那肯定比不过什么open code code这种专门做coding agent, 但是如果是其他的任务的话，它的这个抽象的封装的少的话，那可能就比较有优势了。 Q: general 和 coding 都会有，就像公司里即有文员也有程序员

齐飞与王左的聊天记录 ​

2026-03-08 ​

2026-03-12 ​

2026-03-09 ​

2026-03-10 ​