AI 軟體 3.0:別怕取代,先把鋼鐵人戰衣穿好

近幾年,你一定被各種「AI 會搶走你的工作」的標題瘋狂洗版,再加上一句「快買我們的課,才能活下來」,簡直像一場劇情重播了無數次的恐慌行銷。不過最近,前 Tesla 人工智慧總監 Andrej Karpathy 在 YouTube 上釋最新的一場演講 〈Andrej Karpathy: Software Is Changing〉,則提出了不同的觀點。他說得直白:真正能夠獨立完成工作的智慧代理(Agent),至少還要再等十年。與其焦慮,不如先了解 Karpathy 在演講中提到的「軟體三世代」變化,提前把該準備的武器收進口袋。

Karpathy 在短短一個多小時的演講裡,清楚地將過去七十年軟體開發的演進濃縮為三個階段:Software 1.0 時代,工程師用傳統方式逐行寫下程式碼;Software 2.0 開始轉變為透過資料與神經網路的權重自動學習,取代大量手寫邏輯;而現在剛剛崛起的 Software 3.0,則直接將程式語言替換成像英文這樣的自然語言,只需要透過一句簡單的提示詞(prompt),就能驅動大型語言模型(LLM)來執行各種工作。

版本關鍵做法誰在動手代表畫面
1.0手寫程式碼(如 C++)工程師(軟體開發人員)GitHub 填滿螢幕
2.0神經網路的權重(透過調整資料、運行優化器產生)資料科學家 / ML 工程師GPU 轟隆作響(推斷)
3.0Prompt(提示)來編程大型語言模型(LLM)任何會說話的人ChatGPT 一行行對話
網路上不乏針對 Vibe Coding 的幽默梗圖,但也是「進入軟體開發的入門藥」(gateway drug to software development),因為它讓不會編程的人也能快速實現想法。

從鍵盤敲程式到開口說人話

回想一下軟體開發的 1.0 時代,工程師必須用 C++ 或 Python 等語言,一行行親手寫下清楚的程式邏輯。這種方式雖然繁瑣、維護起來不輕鬆,但至少每一步都掌握在自己手裡。接下來來到 2.0 世代,開發模式有了明顯變化:工程師改為像「飼養」模型一樣,負責收集資料、調整超參數,讓神經網路的權重自行長出所需的功能。Karpathy 在 Tesla 負責 Autopilot 專案時,就親眼目睹了這種改變:過去大量 C++ 的邏輯逐漸被神經網路取代,像是影像融合、車道辨識,最後通通交由 GPU 處理。

到了最近,軟體開發又迎來更戲劇性的轉變,也就是 Karpathy 提出的 3.0 世代:只要會打字、懂英文,任何人都能透過聊天視窗,用自然語言「寫」程式。這乍聽像是科幻電影,但其實每天打開 ChatGPT、Gemini 或 Claude,我們早已不知不覺地在用母語對電腦下指令,背後的語言模型(LLM)則在雲端迅速執行,並回傳結果。

但這種「人類精神模擬器」並非完美無缺。LLM 確實擁有超強的能力,但也有些明顯的毛病。舉例來說,它們就像電影《雨人》主角一樣記憶力超群,任何冷門知識都能輕易說出口;但它們也有嚴重的「幻覺問題」,會理直氣壯地宣稱 strawberry 裡有兩個 r,還不接受你的反駁。另外,LLM 的工作記憶也非常短暫,像電影《記憶拼圖》主角每天早上醒來就完全忘記前一天的事情,每次聊天一結束,前面的內容就消失得無影無蹤。此外,它們也很容易被「騙」,Prompt Injection 或資料外洩的風險一直存在,因此企業在使用時,仍必須謹慎加上防護措施。

簡單來說,我們不能把 LLM 當成完美的萬能外掛,而應視之為一位能力強大但偶爾亂說話的新同事。我們要給它足夠清晰的步驟說明,並在人類端做好最後的把關,才能真正發揮它的潛力,同時避免犯下不必要的錯誤。

「我喜歡把 LLM 想像成人類精神(people spirits),它們是人的隨機模擬(stoastic simulations of people),而模擬器恰好是一個自回歸 Transformer(auto regressive transformer)。」


別急著追夢全自動,先學會「半自動」

這也正是為什麼 Karpathy 一直強調「部分自動化應用程式(Partial Autonomy App)」這個概念。他將其比喻為「鋼鐵人戰衣」而非全自動的自走砲。以寫程式為例,與其把整個專案完全交給 AI 大幅修改上萬行程式碼,不如像 Cursor 等工具一樣,讓使用者自己決定「自主性滑桿」的位置:你可以只讓 AI 協助單行的程式碼補全,也可以放心交給它重構整個專案,而每一次修改都有清晰易懂的紅綠色差異提示,讓使用者能夠快速判斷是否採用。這種方法的重點不是炫耀 AI 的能力,而是讓「AI 生成 → 人類驗證」的循環過程變得更快、更順暢。

此外,自然語言逐漸成為新的「程式語言」,大幅降低了軟體開發的門檻,這也帶來了所謂的「氛圍寫程式」(Vibe Coding)風潮。Karpathy 自己親身體驗了這點:他雖然不懂 Swift,但只靠 ChatGPT 幫助,就在一天內做出了一個簡單的 iOS 應用;之後,他又開發了一個能自動將餐廳菜單轉換成圖片的 Menu.app。然而,他很快就發現,真正拖慢他的反而是登入、支付、部署這些繁瑣的 DevOps 流程。他甚至忍不住吐槽:「電腦一直叫我點這個、選那個,不如乾脆你自己做完吧!」這句無奈的感嘆,道出了未來 AI 工具仍有極大進步空間的事實。

而在 Agent 未來逐漸能接手更多工作前,我們現在就必須開始為它們做好基礎建設。例如,在網站上加上一份名為 lm.txt 的文件,用清楚的 Markdown 告訴語言模型「這個網站要怎麼瀏覽」;把文件中「點擊這裡」的指令改成可直接執行的 curl 命令,讓 Agent 不必再費力地模擬滑鼠點擊;或利用 git-ingest 等工具,快速將整個 GitHub 專案轉成純文字格式,方便模型迅速理解和使用。這些小工程雖然看似瑣碎,卻是未來打造一個真正能被 AI「讀懂並寫入」的世界不可或缺的基礎建設。

“…at this stage I would say working with fallible LLMs and so on I would say you know it’s less Iron Man robots and more Iron Man suits that you want to build. It’s less like building flashy demos of autonomous agents and more building partial autonomy products…”

……在這個階段,我會說與容易出錯的大型語言模型(LLMs)合作,你應該更像是在打造鋼鐵人套裝(Iron Man suits),而不是鋼鐵人機器人(Iron Man robots)。與其說是在做一些華而不實的自主代理人(autonomous agents)展示,不如說是在打造部分自動化的產品


市面上的「AI 恐慌包」值得買嗎?

Karpathy 在演講中提到一個讓人印象深刻的例子。2013 年,他第一次體驗自動駕駛汽車:「那一次,我們在 Palo Alto 的高速公路與街道上開了大約三十分鐘,過程完美到完全不需要人類介入。我當時認真覺得,自動駕駛時代很快就要來臨了,因為這一切實在太神奇。」然而,整整十二年過去了,今天的我們卻依然還在研究如何讓自動駕駛變得真正可靠。

正因為有了這樣的經驗,Karpathy 對於最近炒得火熱的 AI Agent 風潮抱持相當謹慎的態度。他直言:「當我看到『2025年將是 Agent 之年』這種說法,我其實感到相當擔心。我認為這並非幾年內就能實現的願景,而是一整個十年的漫長過程。在這段期間,人類必須始終參與其中,謹慎地進行每一個步驟。」

理解到這一點,我們再回頭看看市面上那些賣焦慮的廣告,就會豁然開朗了。真正值得投資的,絕對不是那些標榜「能讓你不被淘汰」的速成班,而是可以幫助你扎扎實實練好以下三種核心技能的工具和社群:

  • 寫碼基本功(1.0),學會理解電腦與邏輯運作;
  • 資料與模型思維(2.0),了解神經網路的權重如何從資料中長出能力;
  • Prompt 設計能力(3.0),學會與 LLM 對話,善用這種嶄新的自然語言程式設計方式。

當你能夠自在地在這三種抽象層次之間切換,你就不會是那個隨時能被取代的小螺絲,而是一個能夠自信地駕駛「鋼鐵人戰衣」的人。


十年長跑,現在就站上起跑線

Karpathy 最後提醒我們:Agent 的全面爆發不會在明年,而是未來十年的長跑。所以趁現在,我們還有足夠的時間把裝備磨尖、準備充足,開始練習把文件寫給 AI 讀,打造便於人類快速驗證的圖形界面(GUI),並掌握如何透過 Prompt 與 AI 流暢對話,把 AI 真正變成能力增幅器。

下一次再看到「AI 明天就會取代你」這類廣告時,記得先深呼吸一口氣,不用急著焦慮或恐慌。真正該做的,是學會如何操控這套最新的科技裝備,與 AI 一起,共同重新打造我們生活與工作的軟體世界。看到「AI 明天就取代你」的標題,先深呼吸。別急著追買「救命包」,先學會駕駛這套新裝備,然後跟 AI 一起,把明日的軟體重新寫過。


已發佈

分類:

作者: