為什麼你的AI助手總是「瞎忙」?Y Combinator CEO揭秘高效AI工程團隊的秘密
📋 Brief
這支影片由Y Combinator的CEO Gary Tan親自介紹他開發的開源工具GStack,如何將Claude Code轉變成一個完整的AI工程團隊。他分享了透過結構化「技能」和團隊協作的模式,AI能從產品構思到設計、開發、測試,實現驚人的軟體開發效率。
⏱️ 內容分段導航
| 時間段 | 內容摘要 |
|---|---|
| 00:09 - 01:21 | 新的軟體開發時代:Agent Era來臨 |
| 01:21 - 02:48 | GStack核心理念:「薄外殼,厚技能」 |
| 02:48 - 07:12 | 透過「辦公時間」技能精煉產品構想 |
| 07:12 - 12:40 | 顛覆傳統:AI瀏覽器自動化與迭代思維 |
| 12:40 - 15:53 | 全面升級:AI設計、審查與品質保證 |
| 15:53 - 19:30 | AI實現「七級軟體工廠」:平行開發與自動測試 |
📖 詳細內容
01|Agent Era來臨:軟體開發新範式
核心觀點: Gary Tan以自身豐富的軟體開發經驗為證,宣布我們已進入「代理時代」(Agent Era),AI將以團隊協作模式執行複雜任務。他透過開發GStack展示了這種新模式的潛力,並表示個人編碼效率因此大幅提升。
重要原話:
"I'm here to tell you we are in a completely new era of building software, the agent era. It turns out the way to get agents to do real work is the same way humans have always done it as a team with roles with process with review."
(原文:我來告訴你,我們正處於一個全新的軟體建構時代,也就是代理時代。事實證明,讓代理做真正工作的方式,就跟人類一直以來團隊合作的方式一樣:有角色、有流程、有審查。)
個人感受: 聽他講到兩個月寫的程式碼,比2013年一整年寫的還要多,我真是目瞪口呆,感覺過去的工作模式可能需要徹底更新了,同時也對這種效率提升感到很興奮。
延伸思考: 這種「代理時代」的變革不只影響工程師,恐怕所有需要協作、有明確流程的工作場景都會被AI重新定義。我們該如何準備好,去領導而不是被動跟隨這些AI團隊?
可參考的行動: 開始關注並嘗試使用GStack或類似的AI協作工具,哪怕只是用它來處理一個小專案,感受一下AI團隊的工作模式。
02|GStack核心理念:「薄外殼,厚技能」
核心觀點: 影片揭示,AI模型單獨操作時容易「漫無目的」和「悄無聲息地出錯」。GStack的核心是提供一個「薄外殼」(thin harness)來引導「厚技能」(fat skills),將單一的AI轉化為具備專科能力的工程團隊,讓AI的智能能真正發揮效用。
重要原話:
"Out of the box, the model wanders. It doesn't know your data well. So, it guesses. And guessing at that scale is how you get plausible looking code that silently breaks. The bottleneck here is not the model's intelligence. As long as you set the models up right, they are already smart enough to do extraordinary work on your codebase. This is backwards. The scaffolding should be trivially thin. GStack is my implementation of the thin harness fat skills approach."
(原文:開箱即用的模型會漫無目的。它不太了解你的資料,所以會亂猜。這種規模的猜測會產生看似合理卻悄悄出錯的程式碼。這裡的瓶頸不在於模型的智能。只要你設定得當,模型已經夠聰明,能在你的程式碼庫上做出非凡的工作。這觀念是錯的。支架應該非常輕薄。GStack就是我對「薄外殼,厚技能」方法的實踐。)
個人感受: 我覺得他點出了關鍵,以前我們都想著模型要多聰明,但他反過來說其實是我們人類要如何提供一個好的框架讓它發揮,這讓我對AI的看法有了新的角度。
延伸思考: 這觀點提醒我們,管理AI的關鍵並非單純提升模型算力或參數,而是設計有效的協作框架和「技能」來引導其智能,這對任何想要整合AI的組織都有啟發。
可參考的行動: 在考慮使用大型語言模型(LLM)解決問題時,先思考如何為其建立明確的角色、任務流程與檢查機制,而不是直接丟問題讓它自由發揮。
03|「辦公時間」技能:產品構思的AI教練
核心觀點: GStack的「辦公時間」(Office Hours)技能,是Y Combinator數十年創業指導經驗的精髓,它能引導用戶以結構化的方式思考產品核心問題,例如用戶痛點、商業模式和市場驗證,避免直接進入開發,確保產品方向的正確性。
重要原話:
"This is actually the distilled version of what is thousands and tens of thousands of hours that the 16 YC partners have spent many many years honing and perfecting. And uh this is a distilled down 10% strength version of what we do at YC every day."
(原文:這實際上是濃縮了Y Combinator 16位合夥人數萬小時、經多年磨練和完善的精髓。這是我們每天在YC所做事情的濃縮版,大約十分之一的效力。)
"What's the strongest evidence that you have that someone actually wants this? This is actually one of the most important questions to ask yourself when you're trying to decide, should I work on project X or work on that startup?"
(原文:你手上最強的證據是什麼,能證明真的有人需要這個東西?這其實是你決定是否該投入某個專案或創業時,最該問自己的問題之一。)
個人感受: 我很喜歡「辦公時間」能像個資深導師一樣,不斷追問核心問題,尤其是那個「最強證據」的問題,讓我的創業腦筋不再只是天馬行空,而是更接地氣。
延伸思考: 如果連AI都能幫助我們在產品初期就進行這麼深度的商業模式驗證和思考,那麼許多創業公司在產品方向上的失敗或許可以大幅減少。這也說明了,即便AI強大,人類的批判性思維和對市場的洞察依然不可或缺,只是AI能協助我們更快觸及這些洞察。
可參考的行動: 無論是個人專案還是公司新產品,都可以嘗試用「辦公時間」的提問方式(例如「誰會真正需要這個?」「痛點是什麼?」「商業模式如何?」)來檢視產品概念,至少回答那六個強制性問題。
04|顛覆傳統:AI瀏覽器自動化與迭代思維
核心觀點: 影片展示了AI如何不僅僅是寫程式,還能透過「AI瀏覽器自動化」技能,以創新的方式解決實際問題,例如處理敏感的稅務文件,同時避免隱私風險。這種互動式的對話過程,讓AI能從多個角度思考並提供傳統思維難以觸及的解決方案。
重要原話:
"The model would be user logs in AI takes over, navigates to tax docs, finds the 1099 ins, downloads it. No plaid, no stored credentials. The user watches the whole thing happen in the visible browser. I mean, what I like about it is it can happen on their actual browser. It's not happening in the cloud."
(原文:模式會是:用戶登入,AI接管,導航至稅務文件,找到1099表格,然後下載。沒有Plaid,不儲存憑證。用戶能看到整個過程在可視的瀏覽器中發生。我的意思是,我喜歡它能直接在用戶的瀏覽器上執行,而不是在雲端。)
個人感受: 看到AI竟然能想出在用戶瀏覽器上直接操作,避開雲端儲存敏感資料的問題,我真心覺得驚訝。這不僅是技術問題,更是對用戶體驗和隱私的深刻理解。
延伸思考: 這種AI對話和迭代的能力,可以幫助我們跳出既有框架思考問題,激發更多不尋常但有效的解決方案。這對產品經理或任何需要創新的人來說,都是一個強大的協作工具。
可參考的行動: 下次遇到看似僵局的問題時,嘗試用AI工具來進行「對話式」的發散性思考,並讓它提出至少三種不同視角的解決方案,或許會有意想不到的收穫。
05|全面升級:AI設計、審查與品質保證
核心觀點: GStack不僅限於產品構思和編碼,它還提供了「對抗性審查」(Adversarial Review)來自動發現並修正設計文檔中的問題,以及「設計散彈槍」(Design Shotgun)工具,能在短時間內生成多個UI/UX設計方案,再由用戶選擇。這大大加速了從概念到視覺呈現的流程,同時提升了產品品質。
重要原話:
"Now, what it's doing is a multi-step adversarial review. It's trying to put your idea through the paces. And as you can see, it's already found a bunch of things and it's going to try to autofix it."
(原文:現在它正在進行多步驟的對抗性審查。它試圖讓你的想法經受考驗。如你所見,它已經發現了一堆問題,並將嘗試自動修復。)
"It'll actually generate multiple AI versions and then ask us questions about it."
(原文:它會實際生成多個AI版本,然後向我們提出相關問題。)
個人感受: 「對抗性審查」能自動抓出問題並修復,我覺得超實用,節省了好多人工審查的時間。而「設計散彈槍」更是讓我對AI的設計能力刮目相看,一次給好幾個方案,比等一個設計師出稿快多了。
延伸思考: 將AI融入產品設計和審查流程,可以顯著縮短開發週期並減少潛在錯誤。這使得小團隊或個人開發者也能具備大型團隊的效率和多角度審視能力。
可參考的行動: 在產品設計初期,除了內部討論,可以嘗試將設計稿或產品規範輸入AI工具,利用其審查功能找出潛在問題或提供不同設計方向的建議。
06|AI實現「七級軟體工廠」:平行開發與自動測試
核心觀點: Gary Tan指出GStack有助於實現「七級軟體工廠」,讓開發者能同時處理多個專案或在同一專案中並行開發多個功能。透過自動化QA和瀏覽器測試工具(SLQA, SL Browse),GStack解決了長期以來QA作為瓶頸的問題,讓AI代理能執行從規劃、設計、編碼到測試的全生命週期任務。
重要原話:
"GStack does not get you to level 8, but I do think it gets you to level seven. And that's where I can run multiple conductor windows on different projects and sometimes three or four all on the same project all at the same time. These are parallel PRs with parallel branches and parallel different features that all can land more or less simultaneously."
(原文:GStack並沒有把你帶到第八級,但我認為它能把你帶到第七級。在那裡,我可以在不同的專案上運行多個Conductor視窗,有時甚至在同一個專案上同時運行三四個。這些是並行PR、並行分支和並行不同功能,它們都可以或多或少同時落地。)
"I basically wrapped Playright at the CLI level. And now your cloud code and any agent now can actually just use the browser."
(原文:我基本上是在CLI層面封裝了Playwright。現在你的cloud code和任何代理都可以直接使用瀏覽器了。)
個人感受: 我一直覺得QA是很枯燥但重要的環節,聽到GStack能自動化這個部分,甚至能讓AI直接操作瀏覽器進行複雜測試,真是太酷了,感覺離真正高效的開發模式又近了一大步。
延伸思考: 當AI能夠完全接管枯燥重複的測試工作,工程師就能將更多精力投入到創新和更高層次的架構設計上。這將極大改變軟體開發團隊的職能分工和人才需求。
可參考的行動: 審視目前專案中的重複性測試工作,研究如何引入自動化測試框架(如Playwright)並探索AI代理與之結合的可能性,以釋放團隊的生產力。
💎 精華收穫
Gary Tan的GStack展示了AI從單純的輔助工具,轉變為一個具備「技能」和「角色」的協作團隊的巨大潛力。它不僅能大幅加速軟體開發的每個環節——從產品構思、設計、編碼到測試——更重要的是,它透過結構化的引導和迭代對話,幫助我們發掘更好的解決方案,甚至避免無意義的投入。這提醒我們,未來與AI協作的關鍵,在於設計精良的框架來引導其智能,而非僅僅追求模型的聰明程度。
由 PotatoLearning Hub 自动生成