偶然與突破：看曆本純一教授《最終講義》雜感

暦本純一教授在東京大學資訊學環任教多年，同時長期在 Sony CSL 進行跨學科研究。他的最終講義〈Homo Cyberneticus：Human–AI Integrationの時代へ〉於 2026 年 2 月 28 日舉行，這場演講不只是退休前的回顧，而是從個人研究歷程出發，重新思考人、電腦、AI 之間關係的變化。看完後，最吸引我的不是某一項單一技術，而是他整個研究人生中反覆出現的「偶然」。這些偶然不是浪漫化的靈感故事，而是他如何在日常經驗、娛樂場景、失敗摩擦與跨領域接觸中，敏銳地抓住一個新的介面問題，並把它推進成真正的技術突破。

第一個偶然，是小學時參觀 1970 年大阪萬博。他在 IBM 展示區體驗到「光筆」，只要點擊螢幕，就能改變畫面上的漫畫劇情。這對當時的孩子來說，不只是看到一台新機器，而是第一次意識到電腦可以被「直接操作」，可以回應人的動作，也可以成為改變故事與世界的媒介。後來他從小學開始自學 Fortran，並逐漸把「介面」視為畢生志業。這個起點很有意思：他不是先被抽象的電腦科學吸引，而是先被一種具體的互動感打動。

第二個偶然，來自 NEC 時期面對真實業務系統的洗禮。暦本教授進入職場時，正值視窗系統與 GUI 的黎明期。他開發能讓程式設計師建立圖形介面的基礎系統，也嘗試類似今日 Google Docs 的多人同步編輯機制。但真正重要的，不只是他做了什麼功能，而是他在業務現場被使用者、客戶、Bug 回報與操作問題反覆修正。這讓他的 HCI 研究不是停留在「理想使用者」的想像中，而是很早就被迫面對：人機介面的問題，往往出現在真實情境裡那些不順、卡住、誤解與不耐煩的瞬間。

第三個偶然，發生在歌舞伎座。他使用耳機導覽時，突然意識到這介面不需要像滑鼠那樣主動操作，也不需要停下來查資料，知識會依照舞台上的情境，自動進入觀眾的理解之中。這個看似與電腦無關的劇場經驗，反而讓他重新思考介面的本質。好的介面不必永遠要求人下指令；它也可以像代理人一樣，理解情境、預判需求，並在適當時刻補上資訊。這個轉折後來成為他走向情境感知介面的重要基礎。

第四個偶然，是他在 Sony CSL 之後，把電腦從螢幕帶回真實空間。他開始研究行動裝置、彩色條碼、二維標記、3D 空間中的互動，讓實體環境可以被電腦辨識，也讓人不再只是透過滑鼠與桌面視窗操作資訊。早在 1990 年代，他就已經在討論如何讓電腦增強我們與真實世界的互動。UIST 1995 收錄的研究〈The World through the Computer〉，正是這條路線的代表之一。 

第五個偶然，則是特雷門琴。這種早期電子樂器靠手部接近改變電容來發聲，讓暦本教授注意到人的手勢其實可以不透過按鍵、不透過滑鼠，也能被系統感知。於是他開始用導電紙與微控制器實驗，最後發展出 SmartSkin。這套系統能感知表面上的多個觸控點，讓人用雙手直接操作互動表面。SmartSkin 論文說明，它是一種讓互動表面進行自由手勢操作的感測基礎設施；這也使後來我們熟悉的雙指縮放、平移等多點觸控手勢，有了很早期的技術雛形。 

如果說 SmartSkin 是讓手指更自然地進入電腦，那麼他近年的靜默語音研究，則是讓語言與意圖更自然地進入 AI。這項研究的起點同樣來自日常矛盾。語音輸入很有效率，但在電車、咖啡店、辦公室裡大聲對 AI 說話，既尷尬、干擾他人，也可能洩露隱私。更重要的是，許多發聲困難者本來就被主流語音介面排除。SottoVoce 專案利用超音波影像與深度學習，辨識無聲發話時口腔與舌頭的動作，進而實現靜默語音互動；該研究發表於 CHI 2019，並獲得 Honourable Mention。

從光筆、歌舞伎耳機導覽、特雷門琴，到靜默語音，暦本教授給我們的啟發是：技術突破不一定來自封閉實驗室裡的線性規劃，反而常常來自一個人是否能在偶然經驗中辨識出「尚未被命名的介面問題」。這些「偶然」之所以能成為突破，是因為他從不區分「這是我的研究領域」和「這跟我無關」，而是永遠在問：「這背後有什麼有趣的問題？」因為，介面不只是工具，而是新的社會關係。人如何與資訊互動？身體如何成為輸入方式？環境如何回應我們？AI 又如何在不打斷生活的情況下，延伸人的感知、表達與思考？

這場最終講義值得推薦給關心 HCI、AI、設計、STS 與未來人機關係的朋友，讓我們一起努力，把生活中的偶然經驗，轉化成重新理解人與世界的各種可能。

Sidewalk | 人行道

Search This Blog

偶然與突破：看曆本純一教授《最終講義》雜感

Comments