齐飞与王左的聊天记录
Since 2026-03-08
以下是手工从微信复制出来的聊天记录,可能有遗漏和署名错误等问题。 聊天记录按照日期分段。 Q 是指齐飞,qfei/qifei/Qi Fei W 是指王左,Wangzuo
2026-03-08
Q: https://github.com/jazzqi/chan-trader Q: openclaw 写的 W: [强][强][强] Q: 把技术分析的书籍和资料丢给 notebook lm 蒸馏,然后再给 openclaw 写代码实现 Q: 以前的笔记也都丢给 openclaw,整理成 embeddings W: 可以搞短视频卖课了 Q: 搞个虚拟的量化基金 W: 可以啊 Q: 先试试玩 Q: 能设计成飞轮,让他自我迭代起来就行了 W: 可以参考一下这个skill和cli W: https://npmx.dev/package-code/@moonpay/cli/v/0.6.29/skills Q: 我觉得区块链交易层不重要 Q: 主要还是要有完善的基本面和技术分析、决策、自我优化的基金架构 Q: 其实就是模拟一个基金公司 Q: AI驱动的量化基金 Q: 首先有一个大的框架,类似 openclaw,然后各个Agent去分工 Q: 会有开发各种因子的程序员Agent Q: 也会有传统基金里的技术分析师、基本面分析师,审计、仓位管理 Q: 也会有董事投票之类的机制 Q: 总之,就是把整个基金用AI agent模拟 Q: 投资的未必是 crypto W: Multi agent和subagent 不用着急 Q: 先有一个大的框架,这个框架先固定下来,然后让Agent在各个因子上独立的去尝试 W: 我刚好搞了一个架构,可以尝试一下 Q: 就像 openclaw 确定,skill 各自尝试 W: 嗯 W: bash-agent.com Q: 框架是固定的,然后下层的,随时迭代 Q: 达成自迭代飞轮 W: 我想的是把coding agent的架构用到其它领域 W: 其实就是写skill Q: 对 W: 还有一个fs W: directory structure W: https://www.ycombinator.com/rfs#ai-native-hedge-funds Q: 诺奖得主警告:公司最完美的员工数量,是0 Q: 最终的效果就是不需要人再去介入,自我迭代进化的基金 W: 目标确定 W: 开始爬山 Q: 爬山? W: 比喻 Q: 对头 W: 每个agent都是一个git 来记录 W: 一个规范的文件目录 W: 可以看log W: 合并 Q: 设计出有一个大框架,然后就像前面我说的,前期由人丢书给notebook lm,自动生成量化因子代码,后续验证评估因子效果,迭代优化,都自动化。再后来,发现量化因子也由ai自我决策。 Q: 对,每个量化因子的开发都是独立 git,就像 skill W: 整个fund就是一个git Q: 一个 mono repo W: 嗯 W: 回头meet一下 W: 你最近忙不 Q: 可以 Q: 语音呗 W: 嗯,我给你看看现在的工作 Q: 看你时间 W: 这是一个好方向,把之前的研究连起来了 W: 还有现在的东西 Q: 其实正好就是把我们的编程经验,投资经验,在华兴的所见所闻,综合起来 W: 我没啥投资经验哈 Q: 其实,投行里的所有人,本质上都是知识劳动者,大量投行新手都没有行业经验的毕业生 Q: AI很适合替代投行,特别是不需要跟人交流的量化投行 W: ai-native fund Q: 只要实现飞轮效应,我相信。应该会不错的 Q: 未来这个基金甚至可以完全跑在区块链上 Q: 投资人通过区块链入金,通过区块链获取分红 Q: 但是这个我觉得不着急 W: 先pay our bills Q: 就相当于发币了 W: agent + fs 一切决策都是透明的 Q: 靠区块链募资也不用跟人打交道 Q: fs 是啥 W: file system W: git Q: 哦哦
Q: 做起来,拉投资,用投资人的钱跑 W: 不好搞 Q: 哪方面? W: 资质 Q: 不是 W: 自己复利肯定是最好的 Q: 不是做基金融资,是创业公司天使投资 Q: 创业公司的产品是一个 AI Powered Funds Manager Q: 所以是走天使投资的方式募钱,就像华兴alpha 的客户 W: 你是想卖agent给基金用吗 Q: 不是啊,中间为了盈利,有可能会这么做,但是终局不是这样,这样就太狭隘了 Q: 最终应该是搭建出一个自洽的、自我进化的AI飞轮式基金 W: ai巴菲特多好 W: 拿了别人的钱没那么简单的 Q: ai 巴菲特只是其中的一个量化因子 W: 不过不着急 Q: 你这么想,你做的事情其实是创造一个虚拟的公司 Q: 你在优化的是这个公司的架构 Q: 最终公司应该是自己跑起来的 Q: 我们只是 kickstarter Q: 融了钱就是全职做了 W: 你不是全职嘛 Q: 不一样 Q: 0 人公司的概念 Q: 拉投资人,烧 token,也通过投资人获取更多现实中量化基金的信息,优化架构 Q: 护城河就是烧掉的海量 token 最后蒸馏出来的 skill.md W: 但很容易抄走 Q: 首先是闭源的,其实你这么想所有的公司组织也基本都是开源的,但你不容易直接复制一个公司 Q: 其次,如果能形成飞轮效应,后来者不容易追上来,毕竟大家使用的大模型是类似的 Q: 最后可以是一个开源的跑在区块链上的基金。但那是很终局了,如果那样,也可能是一个类似于openclaw 的开源项目 Q: 或者类似 minimax deepseek 开放权重的“虚拟基金” Q: 如果从 ASI 的终局角度看,现在人类做的事情都是没有壁垒的 W: 关键这玩意得赚钱 W: 不想别的行业比如教育 Q: 先融资 W: 很难,以我们的背景 Q: 一开始不要考虑能赚钱,初期都在搭建闭环模型 Q: 我觉得可以试试 Q: 反倒是教育 W: 如果能跑起来赚到钱也不错 Q: 我觉得传统的 k12 很夕阳行业了 W: 我的意思是金融不像别的行业跑起来就行,得有收益 Q: 有收益当然重要,但关键点不是做基金,是生产“基金公司”,这个有区别 Q: 类似 meta fund,元基金? W: 那还是有点像卖agent? Q: 卖 agent orchestra W: 那也是卖infra了 Q: 不是,这个是竞争力和价值的体现,不必拿来卖 W: 有点远,我觉得如果我们能自己跑起来有盈利记录就会更清楚一些 Q: 盈利是随机,依靠概率和机会的 W: 没办法,任何人都能vibe一个类似的东西出来 Q: 造的就是一个,通过一些机制,能够识别和抓住机会,通过概率不断积累的机器 Q: 不太能 vibe 一个完整的 Q: 反复 vibe 蒸馏,到闭环 vibe 自蒸馏 Q: 烧更多 token vibe 出来更高维度的组织架构,所以必须融资 W: 技术上不好说 W: 蒸馏训练不是这么做的 Q: 那是个比喻 W: 我觉得要做就是自己赚钱为目标 W: 做自己的ai native fund Q: 那我感觉不太行 Q: 规模很难做上去 W: 关键烧token不会更强 W: 这个是肯定的 W: 还是要靠人的知识引导 W: 闭环进化做不到的 Q: 造闭环 W: 至少我们做不到 Q: 想办法做 W: 最终还是要证明能赚钱 Q: 逻辑上自洽 W: 闭环也要做evaluation W: 还是收益最重要 Q: agent evaluation W: 做法应该是给基金部署agent 让人来evaluate W: 然后再调模型 W: 自己跑烧token是没办法提高的 Q: 那没太大意义 Q: 那就是 SaaS W: agent没办法自己改进自己的 W: 除非你去忽悠
2026-03-12
Q: 其实就是 agent PUA agent,人类社会本质上不也是这样? W: 但是llm和人还是不一样 Q: 飞轮本质上不就是个 function 递归吗? W: 现在的rl 都是要人的高质量数据 Q: 只是早期阶段,未来 github 上都是 vibe 代码的时候,claude code 怎么学呢?一样的道理,递归式的 vibe 就是飞轮,就是蒸馏 W: 花很多钱雇人啊 Q: 我其实觉得人真的没有什么特别的,一个 llm,一个 world model,基本上就能实现 AGI Q: 没有雇佣很多人的,minimax 才400多人 Q: mmt 1400 多人,华为智驾 4000 多人 W: 你知道这些OpenAI这些就花很多钱去买很高质量的数据,Mini max这种就可以用它的数据来训练,这个应该是公认的。 Q: 没错呀,这不就证明了蒸馏的价值 Q: agent evaluate agent W: 蒸馏不是agent,evaluate agent, 他这个agent自己再怎么烧token,他也不会很难提高自己的。 Q: 我觉得投资还是比 LLM 容易很多的,很多 rule based,可以通过代码固化高效的实现,不需要 RL,agent evaluate agent 应该是够用的 W: 对呀,所以你最终还是要靠你的收益来说话嘛,对吧,就是你哪怕你的你真有真的A卷,自己真的提升,你最后还是要只能靠这个收益来说话,那你都是都能提高收益了,那这个东西就。可能你做的事情就很多嘛,你就那说白了,最终还是你A着一Val a着你最终还是靠这个收益来,你说实话,你说一个决策对还是不错,最终也只能靠收益来做。 Q: 做投资的时候,你只需要把代码化的东西固定下来,需要主观判断的部分,通过大模型来做 Q: Evaluate也只是改善代码和 prompt Q: 所以并不是真正做深度学习的 RL W: 你可以去改善Prompt和代码也是这个的那一种吧,也有也包括那个这方面很多人都在做的这个,但是你。说实话,这个你比如说你让Agent自己去生成一个skill等类似的研究,都表明他其实他自己心里的skill是跟人比是差很多的,基本上可能没有不会提升或者是。甚至是负面的。 Q: 但是一时间没法真的 vibe 出来做验证,先讨论逻辑上是否自洽了 Q: 现阶段 agent eval agent 肯定是不好用的,但真的好用了,机会就没了 W: 这个不是很新的研究的,你想想就是说你哪怕就是说你做好了,对吧,你要怎么去说明你做的好,那就是要做benchmark,那benchmark很明显,就比如说你做。你比如说你的data赛是比如说一些新闻啊,对吧,然后股票的信息,然后最终还是要做回测去啊,证明你的这个Agent的效果好,对吧,那这个东西肯定是有现成的研究的,你这个肯定不是什么。也不是什么很新的想法,对吧,肯定很有很多人会从去做这个语言模型,在金融方面这边的能力。 W: 包括之前那些跑实盘的那些比赛,对吧?那这都都是一个道理。那你最终还是要靠这个benchmark来说话的,你很难通过别的去说服别人。 Q: 你说的这两点,其实都可解释 W: 说白了还是得赚钱 W: 要不然就是SaaS Q: 回测和 benchmark 都是要实现的关键组件,更关键的是实现这些组件的自我迭代闭环,这个闭环能力是最重要的 Q: 实盘的人未必是一个人,可能本身就是一个组织,实盘第一的人也未必一直能实盘第一,自我闭环迭代的能力比某一次实盘第一更重要,能在长期概率上取胜 Q: 只要能把这种自我迭代的闭环跑通,从概率论上看长期一定是跑赢的 W: 嗯 Q: 其实,你从第一性原理上考虑,投行这种纯知识类的公司,终局大概就是这样的 Q: 其他纯知识类的 Know-how 类的公司,也都应该是这样,我现在只是想到投行的价值最大,所以替代投行是一个不错的机会 W: 你现在这个最大问题就是你这个想法是,但是你这个a AI native的话,对吧,你要把这个架构确认清楚到通过这个。有哪些skill,哪些价格,这个还是有很多事情要做的。 W: 其实就是比如说你把这个像像我们现在的很多做法,就就是一个get的一个template里面哪个写好哪个文件干嘛的,然后一些skill文件。直接就就可以用什么open codex啊,什么claude code什么的,就以现成的agent去跑你的任务了,就已经可以试了,那就不需要去云端再搞什么架构什么的,马上就可以开始测试了,本地。 Q: 架构先想想呗,模拟自己开一家投行 Q: 从零开始,指挥 agent 开始工作 Q: 搞一搞,尝试拉融资吧 Q: 教育未来也要大变局 W: 教育说白了这个东西,哎,就跟这个政府一样,就很变得很慢的,而且说白了,你其实没有很多钱的,没有什么钱啊,这个很多还是这个。教培的钱。 W: 你这个AI投资,要是投资或者是AI做这个投资能赚钱,那肯定是变革是最快的。 Q: 感觉社会层面还没有意识到 AI 时代快速大变局 Q: 未来几年的白领失业潮,信贷危机,供给过剩,需求不足,经济大通缩,政府干预,UBI,再通胀。。。大部分人还没有意识到 W: 大部分人用的都是免费AI呀,那免费AI什么就搜个问题呀,回答个问题没有没有跑过那种A选的任务啊,那都是几百块一个月。 Q: 你从我们聊得基于人工智能的虚拟公司角度考虑一下?未来的公司没有员工了 Q: 可大部分人,现在只是把豆包当搜索引擎、当小助手来用 Q: SaaS 不如 SaaC,Software as a Company Q: SaaS 只是 MCP 层面的一个组件,搭建更高层次的组织结构才有价值 W: https://www.ycombinator.com/rfs#ai-native-hedge-funds Q: 就是这样 Q: 2026 Spring,即使在 YC 看来也是最新的 Trending W: 也有可能变韭菜 Q: 融资,花投资人的钱 W: 难 W: 咱两的背景 Q: 融资看的是未来的现金流 W: 除非有收益 Q: 我觉得咱俩背景可以,真正长期搞量化的,可能一直在修补旧系统,未必有魄力从零搭建 AI native 的系统,即使有,他们也不会通过天使投资的方式募资,所以这个赛道做的人不会很多 Q: 你的思维还是做量化投资本身 Q: 做的事应该是搭建能自我迭代的量化投资基金 Q: 投资收益是二阶成果 W: 准备下! W: 你在北京可以找人聊聊? Q: 找投资人? Q: 可以找一些人聊聊,包括以前华兴的同事,看他们有没有兴趣,我们俩拿点启动资金,全职搞 W: 你还差这点启动资金 W: [旺柴] Q: 那不更正式,更有仪式感? Q: 你再想想,有个冷静期,有啥问题和想法先聊清晰 Q: 2. 融资策略:阶梯式混合融资 在 2026 年,VC 更看重“AI 生产力增益”而非仅仅是“模型规模”。 第一阶段:天使/种子轮 (架构溢价) 目标: 融资 300万 - 500万美元。 卖点: “投行架构的数字化协议”。强调你们不是在雇人写代码,而是在建立一套能够自动产生代码的“工厂”。 投资者: 寻找专注于 AI Infrastructure 或 Fintech 的 VC(如 a16z, Sequoia 的 AI 专项基金)。 W: 想多了 Q: 在美国有溢价 W: 有点naive了 Q: 中国的是pdd白菜价 Q: Gemini 说的[Onlooker] W: [捂脸] Q: 本来就是这样,meta 的 AI 程序员拿 60w $, 同等在中国也就是 100w ¥ W: 咱俩背景差太多了 Q: a16z不可能投大陆团队的 W: 别发ai了 Q: ai 内容当头脑风暴来看 W: 在调查一下 W: 找投资人聊聊 W: 我觉得肯定有在做的 W: yc能提出来肯定就有 Q: 必然有在做,但是也没有冲突 W: 融资会很难 W: 要做好准备 Q: 说说你对融资的预期 W: 基本不可能以我们的背景 W: 除非跑起来赚到钱 Q: AI 时代要啥背景? Q: vibe coding 的门槛,还是量化算法的门槛? Q: 我觉得 VC 愿意投的 Q: AI 确定性的机会就那么些 W: 我们的经历 Q: 你吐槽的具体点,作为反驳测试 W: 如果我们是xx基金的合伙人出来搞融资就会很容易 Q: 没意义,核心逻辑不是靠以往的基金投资业绩 Q: 各种基金投资流派本来就很多,比来比去也没意义 Q: 而且那不是融资,只是基金募资了 Q: 基金做的事情是拿钱赚钱,我们是打造 AI 原生的闭环赚钱的机器 W: 早期比较看人经历的 W: 你有认识的投资人么 Q: 打 cold call Q: 只要这个事情逻辑上自洽合理,我觉得可以找到认可的投资人 W: 可以的 W: 肯定是可以做的 W: 看决心了 W: 决心是最重要的 Q: 你可以想想国内具有 AI 背景,了解投资,在投行工作过的人,有多少?在 AI Agents 爆发的这个时间点,出来做这个事情的人,又有多少? W: 齐总 Q: 我说拿 VC 的钱,走这个模式,也是一种自我约束,搞个小 bot,赚点钱或者亏光了,可能就结束了,本质上可能只是运气。 W: 王总 Q: 做成一个商业模式,更持久 Q: 很可能这个商业模式,恰好也是第一波完全无人化的商业模式 Q: 我们只是尝试做 kick starter W: 第一个ai驱动基金 W: [旺柴] Q: 至少是第一批吧 Q: (这个模式也能用来替换其他的纯 know how 公司 Q: 别的公司产出的是服务,我们的产出是虚拟公司,虚拟公司的二阶产物是服务/盈利 Q: 这个模式不仅仅适用于量化基金,或许可以替代掉当前大多数公司的商业模式 Q: https://www.youtube.com/watch?v=BNDx_kbzl90 Q: 看看这些 crypto KOL,策略上也都是一招鲜,每个人擅长一套交易逻辑,都能被 agent 替代 Q: 把他们的学习资料喂给AI,可以总结出来明确的 rule W: 写agents.md 就行 Q: 差不多,agents.md 本身也是根据很多资料总结出来的 Q: https://github.com/langgenius/dify https://github.com/FoundationAgents/MetaGPT https://github.com/cft0808/edict https://github.com/openclaw/openclaw W: 我给你讲一下bash-agent W: 除了openclaw都有点过时了 Q: Edict 是基于 openclaw 的 Q: https://github.com/cft0808/edict Q: github 上的这几个 ai-hedge-fund 项目和论文,都可以拿去总结 W: 嗯,你发我看看 Q: https://github.com/search?q=ai+fund&type=repositories Q: 包括你刚才投屏的那个论文 Q: 我们直接看总结好了 W: 应该先vibe一个本地demo版本去找一些feedback Q: 好主意 W: 你现在用啥agent Q: openclaw 和 deepseek W: 试试claude code 这种 W: 或者openai codex Q: 用不了 claude Q: 封我号 W: 真正能出活的 W: github copilot, opencode W: 差别很大的 Q: 给个排名 W: 遇事不决就cursor和 copilot W: 各种模型都能用 Q: 不要生成界面,现在只要出一些 script 和 skill 描述,纯文字 W: 生成什么都是 W: 差别很大 Q: 编程的需求会在后期,要写量化因子之类的 W: deepseek 早过时了 Q: 便宜量大 Q: 适合初筛数据 W: 你用kimi/minimax 都比deepseek好 Q: 贵好几倍 W: 不差这点啦 W: 比claude, gpt还是便宜很多的 W: 可以在openrouter用 Q: 都可以,现阶段还不强依赖 Q: 想我先 vibe 一些 demo,通过试错找找感觉 Q: 试错的过程中,思路应该会更清晰 Q: 再上优秀的模型做 vibe W: 我的建议就是用最强的模型试,先知道上限 Q: 上限会变的,新模型发布就就变了 Q: 精益创业 W: 多体验下 Q: 这种就是你说的老版本 agent langchain,不是 skill: https://github.com/AI-Brokers/AIBrokers/blob/main/src/agents/risk_manager.py W: 嗯,现在只需要coding agent W: 你还有做风投的connection么 Q: 我再消化消化 Q: 呃,找找总有的
2026-03-09
Q: telegram 私有 channel 里的信息也可以转发做汇总 W: 嗯,这个事情主要还是看决心 W: 目标很明确 Q: 过了冷静期再看看 Q: clawhub 又崩了 Q: Star 很多 https://github.com/virattt/ai-hedge-fund W: 嗯,昨天想找的是这个 Q: 我看了感觉一般 Q: 一个是你昨天说的架构太老,不是 fs 设计,另外一点,基本上没有自我 evaluation 闭环的能力 Q: 没办法自我进化 Q: self-improving-agent https://github.com/peterskoett/self-improving-agent/blob/master/SKILL.md Q: https://www.theblockbeats.info/flash/335116 Q: 这都能 3000w? Q: https://t.me/q_assistent_bot Q: 试试你能发消息吧? Q: 哦哦,这个我自己的,没泄露就行[破涕为笑] Q: 搞群组 bot 多人协作 Q: 有个做投资的朋友,我下午跟她聊聊 W: 多聊聊 Q: 教育行业范式升级 W: openclaw 国内这么火 W: 感觉还是失业的人太多了 W: fomo 情绪高涨 Q: 打电话ing Q: 对啊 Q: 跟一个 mmt 的前同事聊了下,她后来去做战略投资了 Q: 现在她也想来搞 W: 她也失业了?[旺柴] Q: 我听他的意思,他现在在做好几个创业项目 W: 啥意思 Q: 她好像现在在做一个机器人的初创团队,还有一个珠宝奢饰品创业 W: 她在干啥啊 Q: 在里面帮助做融资,团队建设,招人 Q: 商业拓展 Q: 我理解是类似这样的事情 Q: 我本来还想让她直接投呢 W: 拉皮条咯 Q: 一级市场不就这点事,跟华兴之前干的差不多 W: 谁? W: 你让帮我们搞钱多拓展一下 Q: momenta 的前同事 Q: 项目经理 Q: 国家超算互联网OpenClaw服务接入飞书、企业微信 #OpenClaw #飞书 #企业微信 Q: [旺柴] W: 我对openclaw 不感兴趣 Q: 说出你的想法 W: 我不是说过了么,代码就是一坨,没办法二次开发 W: 就是玩噱头 Q: 我知道 Q: linux 战胜 unix,也不是靠的技术领先 Q: 生态效应 + 开放 + 持续迭代,我觉得这些因素都影响最终结果,并不只是单一技术决定结果,或者说并不只是现阶段 OpenClaw 技术决定结果 W: 技术我已经说了,生态就是skill Q: 那就无所谓 Q: OpenClaw 不行,会有替代 OpenClaw 的东西出现,再不行也可以定制出来一个 OpenClaw W: openclaw最早就是从手机去控制claude code Q: 这个无论是 OpenClaw 还是 Codex,Cursor,Claude Code,都是可以的 W: 我不是不愿意了解,我是看着它火起来的,我只是说不要追热度 Q: 核心是积累下来的 SKILL W: 不是 W: 核心是 context engineering Q: 对,协同 context W: 我建议你都试试,创业者一定要用最强的工具和模型 Q: 不矛盾 Q: 融一笔钱,让你任意烧 W: 烧不了多少钱 Q: 你就说拿到钱,在合理的成本下,能不能烧出来? Q: 烧不了多少钱,那不更好 Q: 逻辑上没有问题啊 W: 做产品不难,烧token能烧都少钱 W: 关键还是怎么赚钱 Q: 基金赚钱是“概率”的事情 Q: 我们的目标是提高这个“概率” W: 公司要有模式 Q: 闭环自主提高“概率” W: 现在聊Ai的项目肯定都fomo Q: 你听说过凯利公式没? W: 还是要先把directory structure 就是 context 理清楚 Q: 你看看凯利公式,赚钱就是纯“概率” https://zh.wikipedia.org/zh-sg/凱利公式 Q: 跟 polymarket 猜输赢的原理一样 Q: 盈亏比 + 胜率 + 凯利公式 W: 嗯,我说的是公司的product market fit Q: 目标用户很多可能,本质上是如果你能造出一个印钞机,你不可能缺少用户 W: 还是要落地一点 Q: 落地一步步来,先设计一个 MVP。我目前的想法是做出一个,可以 builder agent 可以自己搭建因子,并且成功设计出两三个量化因子和宏观因子,并且有一定自我 improve 的架子,再加上 risk management 等 middle office 的 agent。 Q: openclaw 的爆火,对我们是好事 W: 是的 Q: codex,claude code,cursor,你推荐的还有啥来着 W: github copilot opencode 都支持skill W: https://skills.sh/ Q: [OK] 我先玩玩 W: 我觉得目前来看架构路线都挺清楚了,做demo不难,还是要有个roadmap看看怎么搞钱把公司运作起来 Q: 当然了,To Be Done W: 齐总咋这么久突然想起来创业了 Q: 这个模式能想通 Q: 比手撸一个量化基金靠谱 W: 我以為你退休了 Q: gap Q: 还有啥好玩的 awesome list Q: B/S 公式: https://zh.wikipedia.org/wiki/布莱克-舒尔斯模型 Q: 据说高盛的面试题就是让人手推 BS 公式,一般没有人能做到第二步,这玩意丢给 claude code,分分钟就实现了 Q: 爱德华·索普,这个人我觉得你一定要看看,量化基金的祖师爷 W: 开会吧 Q: 对,昨天开始有点能感觉到了 Q: 我负载均衡里接了几十个 Cloudlflare CDN 做反代伪装,之前很稳,现在开始偶尔丢包 W: cf 都是固定的 Q: 可以指定CDN的边缘节点 W: 哪个服务 怎么指定的 Q: 优选 IP W: 哪有这种服务 Q: hack 用法,又不是正式服务 https://www.vpsjxw.com/vps_use/cloudflare_select_ip/ Q: CDN 还能指定 IP,不可能是正常的需求 翻墙的特殊用法 W: 怪不得 W: cf如果走香港节点就用不了大部分ai服务 W: 我一直没想到办法 Q: 你的CF为什么会走香港节点? Q: 你说CDN还是什么? W: worker都会自动走的 W: 用户在香港的话 Q: 你是想 worker 直接 > openai api? Q: 中间不中转一次? W: 为啥要中转 W: 全世界就那么几个地方 W: 其实一开始是不需要的 Q: 因为hk要翻墙才能支持[Onlooker] Q: 而且 openai/claude 会不会因为 IP 太多封账号? Q: 实际上我中转一次都不够,我的 ISP 主机 IP,经常会被认为是 spam,让我输入验证码,所以我又套了一层 wrap,搞成 ipv6 原生地址,才不跳验证码 W: 你要买专业的服务 W: 都是走家用ip Q: 好的 IP 也要买 Q: 家用无所谓了 W: 家用ip最稳定 W: 都是直接入户的 W: 薅ISP羊毛 Q: 我这个 4美元一个月 Q: 最低配了 Q: 我感觉投资人比我们更 fomo W: 冲一波 Q: 冲啊 Q: openclaw 还是挺脆弱的 Q: 手动管理 session。。。 Q: cron 任务污染了我的 main agent session
2026-03-10
Q: 搞了个 HR,接需求生成员工 skill Q: https://www.terminaluse.com/ W: 我好像能装claude code,不知道会不会封号 W: 那你就用opencode W: opencode + openrouter Q: 我看看 W: 或者和我一样就copilot Q: 有啥区别啊 W: copilot 订阅很多模型都有,还可以连opencode Q: [OK] W: 而且比较稳定,毕竟azure W: 也就是10刀 Q: 为啥 cc 这么火出圈 Q: 如果模型能力一样,岂不是没有太大差别 W: 最早做的 Q: 有个想法感觉可以引入价值观倾向 Q: 左派右派倾向 Q: 进取与务实 W: 其实就是个prompt template W: 然后变成一个directory structure Q: 是的,就是通过prompt尽可能描述一个完整的商业组织 W: 一个是structure,一个是我workflow W: 即使是 autonomous agents 也没把有办法像人一样组合在一起,还是要有pipeline/workflow W: 总要有trigger, runtime这些概念 Q: ACP 是干这个的吗 W: 不是 Q: cron timeout loop while for 等等,用这些模拟公司运行 W: 其实就是什么时候react W: react -> call llm W: 现在的mulitagent 其实很多就是subagent,不是autonomous W: autonomous太复杂了 Q: 我觉得不能大规模用 sub,小团队小任务可以 sub Q: 就像公司的组织架构一样,扁平化可能会更好? W: 先跑一个或者几个pipeline W: 相应不同任务 Q: 我先试着看自己看能搞出来一个不 W: 嗯,先写文档 W: 我建议不要让AI生成一堆,哪怕自己写的很乱,再用ai 改进 Q: 我现在有一个文档,各种各样的点子我都先汇总起来 Q: AI生成了一堆,太多了,保存起来很难管理 W: 容易 slop 分散注意力 Q: 我今天有个想法,让AI设计一套文档架构,就是保存我们讨论的思路 W: 要删减一下 Q: 我把前两天的聊天记录一条一条复制到文档里了。拿给AI总结 Q: 复制的手都麻了 W: agent orchestration 你可以看看 Q: OK W: 但是我觉得还是从几个小任务入手 W: 每个任务就是一个skill W: 然后每个任务都输出记录到fs,就可以拼起来了 Q: 其实我的想法是从顶层去出发,Agent自己去招募下级Agent Q: CEO去招聘CTO、CTO组建团队,CEO制定目标,CTO设计方案,团队分工实现 W: https://x.com/arscontexta/status/2026492755430474002 Q: 对,其实skill也就是在干这个事情 Q: context engineering, or maybe auto context engineering Q: Agentic Context Engineering , Plan-Aware Automated Agent Context Engineering Q: 我感觉我就在不断地,发散 > 收敛 > 发散 > 收敛。今天尝试收敛起来。 Q: AI 的 context 不够用会混乱,人也是 W: 所以要用agent去跑特定具体的任务 W: 知道局限在哪 Q: 我把想法收敛起来,你来搭 “hello world” agent 的架子? Q: 按照你对行业最佳实践的理解,搭建一个 State-of-the-Art 的 boilerplate W: 就是一个git W: 然后跑现成最好的coding agent W: 不会比这更好的了 W: 所有都fs化 skill化 Q: 可以 W: 我现在做agent都是这个路子 W: 先不考虑云端服务器什么的 W: 能干活再说 Q: https://mp.weixin.qq.com/s/yasp_N840roIfH5b-LPXHQ?scene=1 W: dify 现在热度下降了很多 Q: 你感觉是为啥? W: 不需要这种流程了 W: 就像写代码不需要编辑器 Q: 成 SaaS 炮灰了 Q: 感觉是抽象度不够高 W: cursor 都有点崩了 W: 所以我觉得fs + skill 是可以直接从模型能力提升中受益的 W: 就是你什么都不做,gpt-5.4 切到 gpt-6 ,你的产品就更强了 Q: 当然啦 W: 做Ai产品一定要以这个为目标 Q: 一个 Agent 是 AGI,一大群 Agent 协作就是 ASI Q: 直到有一天 Model 的 context 达到,足以同时支持一大群 Agent Context,那就是 ASI Native 的时代了。人也不需要做什么了。 W: https://x.com/odysseus0z/status/2030416758138634583 W: just in time Q: 是这个意思 Q: 但不知是编程领域 Q: 现在的人类和五千年的人类从基因生物学上看没区别,但是组织结构的优化,使得同样智商的人创造了远远超出以往的价值 Q: 从大航海时代,诞生了商业公司这种概念,伴随着就是科技革命,相辅相成 W: Skill 真是耗token W: 最近github copilot 可能更新了,加上gpt 5.4 啰里八嗦 W: 好多任务都跑不完 W: opencode 就比较稳定了 Q: 让 agent 学习金字塔模型,提高沟通效率[Smirk] W: 你想的太美好了 Q: 总要乐观,一点点迭代呗 W: 所以要具体的任务,特别是我们有能力判断Ai做的好不好的任务 W: 然后再开始迭代 W: top to bottom 我觉得目前还不行 Q: 监督学习 to 无监督学习 W: 自监督 W: 哈哈 Q: bingo Q: 试试吧,learn by doing W: 我觉得“每个人的基金管理团队” 这个概念不错 W: 前期比较好理解 Q: 也可能就是我们自己的基金 Q: 总之,产出的是一个“基金机构” W: 可能要crypto first Q: 往大了拓展,也可以生产别的类型的公司 Q: Crypto我觉得肯定是很重要的一部分 W: 👌 W: 类似回测 Q: 没错,回测也是最容易 evalutate 的,应该比较容易实现自监督 Q: 咱们换到 telegram 聊吧,搞个 group,我更容易导出聊天记录,做总结[Lol] Q: https://t.me/+CmxUSDr3LehmMjY1 W: [good] Q: 张小龙不封他?ChatGPT刚出来的时候,我搞了一个通过网页版微信逆向工程接入GPT API的工具,用了大概两三天,就被微信警告了。后来我的账号甚至都不能登网页版的微信 W: 嗯 别乱试 Q: 歪个楼,我觉得未来关于真人身份验证也有很大的机会 Q: AI 时代的 CAPTCHA Q: 小红书发布公告:将严格打击AI托管类账号 W: 肯定会有一些反AI社区 W: 真人交流 Q: 不介入物理世界,应该很难实现。图灵测试已经失效了。 W: 主要是成本和规模 Q: 扫描虹膜吧 W: 交友网站其实已经在做验证这个事情 Q: 我感觉很难实现 W: 你搜一个大超说媒 W: 相亲要验资面试 W: 挺有意思 Q: 说白了还是要依赖外部验证,而且银行截图也不可靠,AI 能模仿 W: 就是成本和规模 W: 但是我觉得这种真人场景需求不会太大 W: 不如断网回归现实 W: 你也是币圈的人吗 [旺柴] Q: 我确实是 fomo 的人 Q: AI 革命前的萧条 Q: 高收入白领失业,又没有UBI,攻击端过剩,但是需求端垮了 Q: 这个叙事解释最近美股崩盘 Q: 供给端* W: 你都躺平了fomo个啥 Q: 乐观主义者就会 fomo Q: Meta 收购 AI 社交网络平台 Moltbook。(AXIOS) W: meta fomo 了 Q: 哈哈哈🤣 Q: 我当时买了点 WLD,太鸡贼了[破涕为笑] W: 给我github Q: github organization invite 你了 W: ok W: 2049? Q: 防止重命名临时起的,建国 100 年[Doge],也是银翼杀手 2049 的年份,人造人跟人类已经很难分清了 W: https://github.com/ACE-2049/fund Q: hello world Q: nb W: 1. task -> skill -> orchestration 2. role -> team -> company Q: 你先发挥来一版 W: 你先定义一些简单的task和流程 W: 我来测试一下 Q: 所以 fund repo 里面只有一个 agent? W: 可以分目录 Q: 在 root 下分 agent workspace folder? Q: 你再加一个 HR 的空 agent Q: 我补充内容 W: 可以试试 Q: 我对 fs 组织方式还不熟 Q: 昨天看了一部分,又忘了点 Q: 先手工搞下,然后 copilot 了 W: 这玩意现在没有最佳实践 Q: 明白了 W: 随便搞 W: 主要是看效果 W: 再迭代 W: 你就别想agent W: 想怎么让一个公司所有人高效分享数据 Q: HR 就是个中间层啊,要跟上下游沟通! Q: 本技能让HR Agent在完全AI原生的公司中自主完成从需求收集到技能定义的全链路招聘闭环。主要价值: - 消除人类HR与部门间反复确认的低效沟通 - 用结构化、标准化的方式让用人Agent(部门/项目Agent)一次性讲清楚真实需求 - 输出高质量、可直接发布的招聘文案 + 候选人画像 + 技能清单 - 为未来招聘的AI人才预留“技能即插即用”设计(输出的技能可直接转为Agent Skill) 当以下任一情况发生时,应主动激活本技能: - 收到来自其他Agent的招聘请求消息 - 系统检测到团队算力/角色缺口告警 - 项目Agent提出新增协作角色需求 - 高层Agent下达人才扩张指令 W: 这种大概率没用 Q: 试试,让 Agent 生成 skill W: 可以参考那个ai-hedge-fund W: 还是要以data和流程为主,role 只是呈现,做demo用的 W: 看起来比较fancy Q: 我设想的一个demo方式就是把那个AI h fund的架构图喂给主Agent,让Agent自动生成一整套agents skill W: 可以先看看它那个怎么做 orchestration Q: 短期从投资收益的角度看效果,肯定是你说的方式最好了,但是有一个问题是,这样我们就是从一个中间切面开始的,向下扩展优化是比较自然的,但是向上扩展很反直觉? W: 只要是fs based 我觉得问题都不打 Q: 可以 W: 你别管什么role,只要整个company run on fs Q: 反正是先 playground W: 先不要用ai生成一堆 W: 没意义的 Q: 我就在 AI 生成。。
2026-03-11
W: 没意义的 W: 只有跑起来能看到效果才有意义 Q: push 了 Q: 你先瞟一眼,明天再加 W: 我不会看这些的 W: slop W: 你就简单列一个文档就行,我给你一个例子 W: 这是一个ai 自动写paper的workspace定义,就有一个这种文档我们一起编辑就行,不要用AI去写, Q: 懂了 W: 文件的目录和每个目录的文件,结构 W: 这个要放到AGENTS.md 里面 W: 属于最高级别的指令 W: 你不用创建一堆目录,AI只要这个指令自己可以去创建相应的目录 Q: agent.md 文件放那 W: 先放root W: https://agents.md/ 这个 W: claude 叫 CLAUDE.md Q: 这个太微观了,看上去就是针对码农专用的 W: 不是 W: 这个相当于system message,只不过放到文件里面了 Q: 我看看再理解一下 W: 上层再怎么花哨,落实到底层也就是一个llm api call Q: 那是 W: 逃不掉的,你不要想着把agent角色写好,所有东西就跑起来了 Q: 尽可能把每一个 context 构造完美 W: 那种东西可能就是一个openclaw群聊小组了,除了烧token做不了啥 Q: 明天在搞,先睡吧 W: ceo 不是一个skill Q: 这块我还没有搞特别清楚,agents里面定义的维度到底是 skill 能力,还是各个 agent,也就是说 skills grouped by agent W: 你就想agent 拿到 这些skill 定义能不能干好活 W: find-news 就是一个很具体的skill Q: 所以这个Agents虽然是plural,但是里定义的是一个Agent? Q: 有没有办法在这个定义层面就把多个Agent隔离开,Skills能力独立配置,不要共享 context W: agent orchestration 是架构,和这个没有关系的 W: 这些都是prompt W: 我一直都让你不要想架构,什么ceo, hr 这种 W: 现在的agent设计还没到那个地步 W: 先想有哪些任务,大部分时候都不需要multi agent,大部分multi agent 也只是看起来fancy Q: 但是这些任务其实本来就是现成的,他应该是被组织架构去推导出来的 Q: 你要做量化用的那些因子,不应该由我们直接决定,应该是一个从上到下推导出来的过程 Q: 哪怕是直接从最上层下了一个命令,比如告诉 CEO 说一定要做某一个量化因子,比如分析热点新闻+流行叙事,筛选热点,自动投资 meme W: 分析热点新闻+流行叙事,筛选热点,自动投资 meme W: 这些就是 skill Q: 没错,但是这个skill不应该由我们来手写 W: 这个得人来写 Q: 应该是让CEO去拆解划分底下实现 Q: 我觉得哪怕是我们把实现思路告诉CEO,然后CEO再通过组织协同去自行实现都可以,要好过我们自己写这些 skill W: 那只能slop了 Q: 咱们不应该作为一个 vibe coding的角色,而是推到下一层 agent 做 vibe coding Q: 人创造的绝大部分信息也都是 slop,AGI 来了,agent 会笑话 UGC 内容才是 slop W: 做demo没有问题 W: 可以先看看效果 Q: 模型能力提升肯定会解决 slop 问题,stable diffusion 刚出出来的时候生成的图片手指都很异常,这不就是明显的slop,但现在手指 slop 问题都解决了 W: 不一样的 Q: https://mp.weixin.qq.com/s/tHkEmHb4XJygmKaOBofjug?scene=1 W: 模型提升的手段相当于手写skill Q: 可以通过公司组织结构,优化 slop,就像人类对抗平庸之恶 W: 模型的能力就是average W: 无解的 W: 你试试嘛 W: ai就是实验科学 Q: 能力是平庸的,但是通过分割的context,可以实现专业分工 W: 反正都是vibe,也不用很多时间 Q: 每个初始模型其实都是刚毕业的大学生,但是入职后,公司按照 job title 做入职培训,给他们各自专业所需的相关资料,让他们去适应各自的职位 Q: 你说让我试试啥? W: 你按照你的想法vibe试试 Q: [好的] Q: 其实你看看川普政府,国防部长,谈判专家,很多都是业余的,从来没在政府里工作过 Q: 本质上不就是一大群 Average Agent + 行业 context W: 不一样的 Q: 他们提供信息给川普,川普根据信息做决定,在指导他们去 vibe Q: 为啥很多人吐槽川普政府是草台班子 Q: 世界就是个巨大的草台班子 W: 草台班子那是因为有前人搭的班子 Q: 这些Agent就是班子,把他们组织起来,就是草台班子 Q: 川普为什么敢把从来没经验的人提到那么高位置 W: demo肯定没问题,主要还是看怎么叙事去融资 W: 因为懂技术搞研究的人会觉得这个做法没有太大价值,太多这种项目了 Q: 其实从现在美股 SaaS 崩塌,可以看到未来单纯服务型的商业模式已经没有价值了,单纯的服务是很容易被替代的,只有说你提供的是一个可以自己净化的服务,也就说像公司一样的组织架构,我觉得才有生命力 Q: 你看,如果单独定义一个Agent,给他设置一大堆skill,这确实是当前 vibe coding 的现状,但本质上不就是Saas 替代吗?没有护城河 Q: 因为我觉得大多数搞这种研究的人还是偏AI,你要搭建一个组织架构,需要理解商业模式和社会学 Q: 比如说,如果你只搞了一个传统公司,给他们各种简单的角色和描述,我觉得要 evolution 很久才会有效果,大多数人是等不到的 Q: 但是如果在一开始就能按照当前最优的组织设计,很可能跳过 slop 阶段 W: 你先vibe试试,多体验一下agent的工作 Q: yes Q: 你觉得是从零开始学编码做编程难,还是从零开始学vibe coding难? Q: 如果说前者更难,AI 已经学会了前者,那么后者没道理学不会 Q: 所以,即使我们都学会了 vibe coding,后面也应该把 vibe coding 本身交给各个 agent W: 还是这个,得边做边招人聊聊 W: 对于我来说各个路线都比较清晰的,你先试试vibe demo,主要熟悉一下coding agent Q: 我聊过一个投资人,他初始的思路和你是比较类似的,希望尽快能有商业化变现的路径 W: 嗯,多聊聊 W: 如果能先帮我们自己赚钱,我们自己先用上也不错的 Q: 但是我给他讲我的思路,包括当前 SaaS行业的变局,还有梁文锋的商业模式等等,他们还是挺兴奋的 W: 嗯,要看人,文科生比较吃这一套 Q: [奸笑]这个有很大的问题 Q: 万一你一笔挣个大的,退休了怎么办 Q: 给你一个小目标,你退休吗 W: 想多了 Q: 很真实的问题,我面对过 W: 那你给我吧 W: fund 我 Q: 哎呀,不用diss文科生,文理结合推动世界发展[奸笑] Q: 没有了啊 Q: 但我觉得未来你肯定也会面对这个问题,到底要不要退休 Q: 我当时是又吭哧吭哧写了几年代码 W: 没有,确实现在文科生更fomo W: wtf W: [裂开] Q: 所以要搞一个长长久久的模式 Q: 只有飞轮式闭环才能长久 Q: 如果单纯依靠我们俩,或者任何一个人,都不长久 Q: 我们就应该成为Kickstarter,后面让这些组织自己去进化 Q: 我们最好一开始就能把组织架构设计得完美一些,减少前期无意义的slop W: 先迭代吧 Q: 只要模型能力还在继续提升,我们及就是什么都不做,slop 也会自己减少 Q: 我们肯定是先迭代,day 1 做不出来闭环,day 30 有个雏形,day 100 完整跑起来,应该就能放开了让这个闭环自己跑着看 W: 这个是对的,但是能不能做到 self improvement 还要看 Q: 我相信一定会的,从第一性原理上看 Q: 这几天我在试试Copilot Q: 给我点时间,我还得再熟悉熟悉 vibe coding Q: 我写代码的时候还没有这玩意儿 W: 是,先熟悉一下工具 W: 以出东西为目标熟悉就很快 W: 我帮你看看 Q: 你有建议没有,或者我先看几个youtube W: 直接上 Q: 正在让copilot给我创建 git,写 commit 呢 Q: 说实话,我看了一下现在的 gitlens 生成的 commit msg,感觉我以前写的 commit msg 都是泔水 W: https://x.com/ashpreetbedi/status/2031416367610744960 W: 减少心智负担 Q: 没错,向量数据库适用于单个 agent 的 context 优化,积累自己的 memory;多 context agent 就是我们说的通过 AGI 协作实现 ASI 的思路。 W: rag 总感觉不对 W: 就是效率还有一些优势 Q: RAG只是单人知识管理 W: rag便宜 Q: 还是可以用 RAG 用来提升单 agent context 效率 Q: 要用 RAG 的 W: 不需要的 W: 咱又不做saas Q: 虽然多 agent 模式拆分了整体 context,但是单一职责的 Agent memory 如果太多了,也许要 rag 优化吧 Q: 我觉得跟做不做 saas 不矛盾,RAG是在单个Agent层面的优化 Q: Agent Orchestration Context + RAG Q: 组织层面 + 个人层面 W: rag主要还是效率 W: 比fs快 Q: 先做FS,太膨胀了再加 RAG,非必要 W: 和单人不单人没有关系 W: 这个技术而已 Q: 如果 orchestration 拆分了 context,实际数量很小,fs 足够了,就没必要 rag Q: context 拆分后依然过于庞大,再 rag W: fs也可以read lines W: rag基本上已经被抛弃了 W: 主要技术上复杂了 W: 做法不够ai Q: grep 呗?没人用就不用,context 大小合理就行 W: 这个东西就是为了效率啊,你用向量数据或者是搜索引擎去搜,那它的效率肯定是比这个A去在loop里面跑边跑边读要快很多。但是他需要你要引入很多依赖,那你现在不用去担心这些,就我说的,你就在那个你用现成的这个coding coding agent去跑就好了,然后可能最多加一些什么browser tool这种浏览器的这些。工具比较实用一点的工具就好了。 Q: 这么说,感觉抽象度还是越来越高了,RAG 还是太具体了,纯文本没必要在优化成向量空间了 W: 同意,是这样 Q: 你你说的很对,这个东西就是无论是什么向量数据库啊,还是什么知识图谱,这些东西最大的问题,它就是你作为人啊,很难去知道一个向量数据库好不好,或者是一个知识图谱构建的好不好。你唯一能做的就是用你的数据库去做benchmark,那这样的话其实非常的不,A native. 那你一个文档写的好不好,人一眼就能看得出来的,其实很多时候。对吧,所以这个做法其实是很合理的。 Q: 其实我觉得可能还是模型的能力进步了,向量数据库和文本相比,性能成本优势越来越不明显,但就像你刚才说的,RAG的劣势很明显,人类没有办法理解,所以在绝大多数的场景下,就淘汰了 W: rag便宜 W: 快 W: 要做to c就没办法 Q: 成自行车的辅助小轮了 W: rag产品好多都凉了 W: 不赚钱 W: 任务太简单 Q: 嗯,其实我觉得完全不是,我可以告诉你一个投资哲学,在AI时代,越早有商业化收入的模式,越早会被淘汰 Q: SaaS 就是前车之鉴 Q: 做任何一个行业的Agent,都不会有技术壁垒 Q: 有商业化收入的商业模式,很快都会陷入竞争性毁灭的模型 W: 比不过manus这种框框干活的 Q: 前浪死在沙滩上 W: 你别管对不对,看在AI这么努力的份上都很专业 W: true Q: 也许哪一天通用模型达到了ASI 的效果,只要跟他说,我有一笔钱投给你,你按照最顶尖基金公司的模式来管理,他就能做到。那我们就也是前浪了可以彻底躺平了。[破涕为笑] Q: 有个美剧同乐者,你看过没有? Q: 我觉得剧里面就很像ASI时代,当然是比较黑暗、荒诞的版本 W: 不好说啊,所有人都有AI Q: 人类都歇菜了呀,成被 AI 保护的动物了 Q: 人类自己造了个硅基版本上帝 W: 别想这么多 Q: 那就是最终极场景嘛,我觉得在那天之前,我们的商业模式都是有价值的 W: 先给我一个小目标 W: [旺柴] Q: 第一个跑起来的基金就叫 Z Fund 吧 Q: Z Fund is the Ultimate Fund,目标是人类的最后一个基金,因为再往后人类就不要货币了[破涕为笑] Q: 歪个楼,我想起来,当年我们在华兴做的,其实就是一个投行定制版的飞书,但是我们那几个人团队的体量不足以支撑起来,飞书这么庞大完善的平台 W: 现在去做肯定不一样 W: Alverify的结果还是要人类verify的,因为LLM的review结果里会有很多falsepositive和false negative的......毕竟 LLM本质上就不是一个靠谱的东西......多轮长对话迭代也不一定会收敛,或者不一定会收敛到正确答案。很多行外人是不理解的......//@热干面塑料袋:有道理,换个AI来verify。。。。.收起 @agentzh 我们已经进入垃圾代码批量制造的时代。老话说,尽信书不如无书。现在尽信AI也不如无Al了。其实用好AI应该像里根总统说的对待前苏联那样:"trust,but verify"。 Q: 这个人说的只是是现状而已,他觉得模型不如人靠谱呗,但实际上很多人也是不靠谱的,永远依赖一个 100% 靠谱的 key person 是不现实的,比如公司里的大牛走了,公司剩下码农的依然要想办法改代码啊 Q: 昨天的 claude code review 就是 evaluate 程序员工作的: https://claude.com/blog/code-review Q: 他说的本质上还是 slop 的问题 W: 训练方式决定的 Q: 随着模型能力改善,slop 一定会逐渐消失,剩下的只有人类的“泔水” Q: 人类拿不准的时候,也会扯皮,也会瞎猜 W: rag 有一个好的地方我忘了说 W: multimodal W: 图片视频embedding Q: 啊对,我们开始应该很少有场景用多模态,需要再加 W: 更多还是 embedding W: 不是rag W: 不过有一种multimodal rag Q: 比如 skill:扫描 youtube KOL 的视频/直播,实时从字幕和音频中识别的信息,必要时自动从实时图像帧里提取关键信息,然后统一汇总? W: 这个要用computer use W: 或者一个workflow 去下载script Q: ytb-dl 啥的 W: 差不多 Q: 配合 ffmpeg,ai 自动多模态提取图像信息,肯定能做 Q: 哈哈,我感觉我们讨论的这些技术问题,其实应该让Agent来想办法[捂脸] Q: 咱俩应该是 infra builder agent 的 coach 或者说顾问 W: agent 比较广泛 W: 你还是太高估了现在的agent W: 试试出活 Q: 不是高估,只是我觉得这个临界点快到了,或者说在局部已经达到了,现在来做,随着模型能力的提升,就是第一批受益的人,做的晚了就没有先发优势了 Q: 而且,要相信 orchestrated 大模型有涌现的能力 Q: 三个臭皮匠,顶个诸葛亮 W: 还是要从外部获取信息 W: 纯烧token肯定不会收敛 Q: 肯定要加外部 Q: “学习资料”、“最佳实践”、“网络信息”、youtube 视频,都是喂给 agent 的 prompt W: 他妈的币圈现在真傻逼,人家用AI提升人类工作效率,改变世界,攻克癌症呢,他妈的,BN在这里上了他妈龙虾两个字,去蹭人家热度,发币卖给韭菜,真他妈傻逼。过个春节你去蹭别人名字发个币,看到什么热点去蹭了发个币,然后上交易所卖给韭菜,怪不得Peter看到币圈的人就直接 拉黑。 Q: meme 就是这 Q: meme 背后的逻辑,我也想透了,跟 polymarket 一样,概率赌场 Q: 但是最关键的不是我们去发现和理解这些投资逻辑 Q: 应该启发Agent独立区发现并追踪和验证投资逻辑 Q: 鼓励式 PUA Agents Q: Anthropic推出Claude Code的Code Review功能(目前为Team和Enterprise计划的研究预览版): .每个PR打开时,自动派遣一个多代理团队并行深度审查 W: https://proofeditor.ai/ W: Hunter Alpha is a 1 Trillion parameter + 1M token context frontier intligence model built for agentic use.It excels at long-horizonplanning,complex reasoning, and sustained multi-step task execution, with the reliability and instruction-following precision that. W: deepseek 或者 meta Q: 是基于这两个? Q: 啥意思? W: 一般都会匿名测试一下 Q: 大公司给测试版本穿的马甲呗 Q: 这名字听着太像量化模型了。。。 Q: https://longbridge.cn/zh-CN/news/278816292?channel=SH000001&invite-code=6E9AUK&app_id=longbridge&utm_source=longbridge_app_share&locale=zh-CN&share_track_id=79cd2e2f-10cc-4d3a-a277-9c5f71873eb1 Q: “递归式自我改进” W: 今天说了个 universal high income Q: 就是“共产主义” Q: AI 时代的乌托邦 Q: 但是这个路径在逻辑上是合理 W: 合理的,但是国内连养老金都不一样 W: 还想着ubi? Q: 国内是假的,忽悠人的 Q: 不过如果能解放思想,180°大转弯,可以实现。物理基础是有的,思想包袱太重。 Q: 每天这么多新概念、新叙事,看都看不过来,都没办法写东西了 Q: 咱们有没有办法采集所有新闻,收集新的概念和叙事,持续追踪(有记忆),筛选出来重要的、原创的叙事,跟踪其演进,在关键时刻,主动提醒我们关注 W: 这个已经是一个很完整的产品了,你可以先搜搜github Q: 没必 github,直接 vibe 出来一个 Q: 这是一个宏观量化因子 W: https://github.com/samgozman/fin-thread https://github.com/AlgoETS/AINewsTracker 参考一下 Q: 不需要 gui Q: 我大概看了一眼,但是感觉他们主要还是集中在收集总结新闻,找热点 W: 嗯 W: 先试试 Q: 缺少一个我觉得非常重要的功能,从新闻里面总结出来多条叙事,并持续追踪这些叙事的趋势 W: 用 bun + typescript 吧 W: 做成一个cli ,然后配合一个skill,让agent自己去用 Q: 新闻里的各种热点,有些昙花一现是无所谓的。但有些东西是草蛇灰线,本来毫无意义,但在某些时刻可以突然连点成线,如果采集系统有记忆,就可以实现这样的功能。然后让我们第一时间的去发现一些新的叙事! Q: 然后我们可以再有一个Agent,根据这些叙事的持续发展做一些概率上的预测,这其实就可以是一个polymarket套利工具 W: 有这个都可以融资了 Q: 同样也可以用在 meme,预测下一个可能爆发的热点叙事,提前埋伏 meme Q: [奸笑] 你来做! W: 我咋做啊 Q: 来吧 ,vibe 一个 Q: 几乎不需要任何Gui Q: focus on data understanding Q: 我自己学 vibe,达到你的理解需要时间 Q: 各种信息穿插进来,又打断我学 vibe Q: 你看你还要去刷 hack news,刷 github trends、刷各种网站 Q: 这些都是心智成本 W: 我最近动力不足 Q: 比如龙虾爆火,导致龙虾的 meme 暴涨,所有了解币圈的人,其实都应该能想到这个逻辑,但是大部分人可能因为各种琐事遗漏了,这个时候,如果有独立的Agent,缩小 context,就不会错过。 W: 毕业又失业 Q: 来融资创业吧 Q: 把 agent 当成员工,以人类商业社会的组织形态,打造出真正的 AI Native 商业模式。 W: 靠谱嘛 W: 我最近几年都burned out 了 Q: 不要再直接用 ai 造轮子了,想办法让Agent理解我们造轮子的思路,学习我们造轮子的方法,替代我们造轮子 Q: 所以我说,我们两个最终都应该尽可能少写代码,不要成为一个Key person,要实现 agent 自我递归进化 Q: 我们就能不再 burn 自己 W: 没那么简单的 Q: 说出来你的担忧 W: 要找工作了 Q: 1. 从 a/b/c/d... 网站分别采集今日新闻,按目录分类 2. 按分类目录,各自合并重复的各条新闻 3. 从各类新闻中发现叙事后跟新到叙事线索中,剩余独立事件尝试从长期记忆中找关联形成新叙事,如果依然不存在关联,将该独立事件保存到长期记忆 4. 对比当前最新的各条叙事线索,判断是否需要合并或者拆分 5. 对最终筛选出的叙事线索,进行评估分析,需要关注或者立刻行动的,发出提醒 6. 预判当前叙事线索的走势发展,如果下一步可能需要行动,发出提醒 W: 最近上不了强度了 W: 太累了 Q: 在干啥啊 W: 没有家庭我可能一个人回乡下了 Q: [Facepalm] W: 最近都没收入了 W: 要先找到工作 Q: 融资 W: 哪有这么容易 Q: 你在香港生活大概需要多少工资 Q: 搞起来了搬去新加坡好了 W: 还有毕业论文在改 W: 我哪有你这么潇洒 W: 这个月大概不行,这个事情还是要专注搞 Q: 没事儿,你先搞你的论文 Q: 我觉得没必要急在这一两天 Q: 我觉得真正在我们开始做之前,这段时间都是个冷静期 Q: 可以从各个方面去考虑,评估后再决定 W: 你是想我们两你负责融资我负责技术吧 Q: 我可以啥都干,而且初期肯定也是啥都干,但是我最终肯定没办法每个领域都 all in Q: 所以你肯定是 CTO W: 差不多 W: 先按照这个思路把roadmap计划一下 Q: 可以,就拿这个试试手 W: 你先整理下新闻源 Q: 现成的,我发给你 Q: General/Finanical * https://t.me/s/Financial_Express * https://t.me/s/jin10light * https://t.me/s/FinanceNewsDaily * https://t.me/s/scmp_zh Crypto * https://t.me/s/theblockbeats * https://t.me/s/cryptocurrency_media * https://t.me/s/ai_9684xtpa Q: 还有好多,先用这几个试试 W: ok W: 看看怎么推进这个事吧 Q: 搞个看板,或者换个有主题的协同工具吧,微信聊天 context 太分散了 Q: 我在试着配置 discord Q: tg group 不太适合 Q: 这也是我这几天考虑的事情,毕竟没有当过 PM [Facepalm] Q: https://discord.gg/wq9SThtj Q: 还用 trello 吗? W: https://github.com/openai/symphony Q: 这个看起来很 AI Native W: 还是elixir W: 我们自己公司也文档化吧 Q: 我有个自己的,还不够结构化,考虑用 ai 整理 Q: 来 discord 吧,自动导出聊天内容,每日总结梳理,高亮重点,包括生成 roadmap 等等。 Q: 这套真人 ops 的自动化我来考虑搭建 W: ok W: 你不如直接vibe个聊天 W: trello W: sqlite 存到fs Q: 聊天出 trello 呗? W: 让agent 直接sql去读 W: 其实有一个sqlite 项目就叫agentfs W: fs 放到sqlite Q: 等等,sqlite fs 和 trello 的关系是啥 W: vibe一个 W: 用sqlite存数据 Q: 其实我觉得用纯文本markdown输出一个看板就行 Q: 不需要人去拖动 card,只要在聊天里提到 card 的相关信息,就能自动更新 card 状态 Q: 这个trello看板就是个聊天记录的 side effect,主要作用只是给人去看当前状态的 W: 嗯 W: ai native Q: 这个连 youtube 都能总结了 https://clawhub.ai/steipete/summarize W: 有的没有自带字幕可能不行 W: 要transcript W: 奥,这个自带了 W: 你推特是啥 Q: 我现在都不发啥 Q: https://x.com/hexorcist_9000 W: 买个会员啊 Q: 有啥用 W: https://www.openui.com/ Q: 可以,当作给我们俩(人类)接入的 UI,但是最好越少越好,GUI 对 AI 来说太昂贵了,不划算 W: 有点类似 json render Q: 对的,prettier, for better human interactive Q: 但是最好是没有 UI,懒才是第一生产力,越少需要人类介入,就越成功 W: Andrew Yang suggests the US should stop taxing humans — should tax AI instead to fund UBI. Q: absolutely Q: AGI 时代,必须 UBI,ASI 时代,则是 UHI Q: cc,codex,copilot 啥的,有个很大的痛点,不能在手机上用,这点真的不如 openclaw! W: 这就是这个openclaw的作者的初衷啊。 Q: 对啊,所以我挺喜欢 openclaw 的,我不一定带着电脑[Facepalm] W: 嗯,Github 的手机版可以用那个copilot直接开那个agent,就是你在那个给他一个request,就可以在那个手机APP里面给他了,给他让他去跑。 Q: 所以你把 skill 放在 .github 目录下是吧 W: dui Q: 👌 W: 每个agent都不一样 W: 很烦 W: 可以用skills.sh 自动装 Q: 这点不如 openclaw,持久化了,我也用 find-skill W: openclaw 用的pi agent W: 我内部有一个类似的轻量agent Q: 感觉以后能用上 W: 如果是coding agent, 那肯定比不过什么open code code这种专门做coding agent, 但是如果是其他的任务的话,它的这个抽象的封装的少的话,那可能就比较有优势了。 Q: general 和 coding 都会有,就像公司里即有文员也有程序员