偶然與突破:看曆本純一教授《最終講義》雜感

暦本純一教授在東京大學資訊學環任教多年,同時長期在 Sony CSL 進行跨學科研究。他的最終講義〈Homo Cyberneticus:Human–AI Integrationの時代へ〉於 2026 年 2 月 28 日舉行,這場演講不只是退休前的回顧,而是從個人研究歷程出發,重新思考人、電腦、AI 之間關係的變化。看完後,最吸引我的不是某一項單一技術,而是他整個研究人生中反覆出現的「偶然」。這些偶然不是浪漫化的靈感故事,而是他如何在日常經驗、娛樂場景、失敗摩擦與跨領域接觸中,敏銳地抓住一個新的介面問題,並把它推進成真正的技術突破。

第一個偶然,是小學時參觀 1970 年大阪萬博。他在 IBM 展示區體驗到「光筆」,只要點擊螢幕,就能改變畫面上的漫畫劇情。這對當時的孩子來說,不只是看到一台新機器,而是第一次意識到電腦可以被「直接操作」,可以回應人的動作,也可以成為改變故事與世界的媒介。後來他從小學開始自學 Fortran,並逐漸把「介面」視為畢生志業。這個起點很有意思:他不是先被抽象的電腦科學吸引,而是先被一種具體的互動感打動。
第二個偶然,來自 NEC 時期面對真實業務系統的洗禮。暦本教授進入職場時,正值視窗系統與 GUI 的黎明期。他開發能讓程式設計師建立圖形介面的基礎系統,也嘗試類似今日 Google Docs 的多人同步編輯機制。但真正重要的,不只是他做了什麼功能,而是他在業務現場被使用者、客戶、Bug 回報與操作問題反覆修正。這讓他的 HCI 研究不是停留在「理想使用者」的想像中,而是很早就被迫面對:人機介面的問題,往往出現在真實情境裡那些不順、卡住、誤解與不耐煩的瞬間。
第三個偶然,發生在歌舞伎座。他使用耳機導覽時,突然意識到這介面不需要像滑鼠那樣主動操作,也不需要停下來查資料,知識會依照舞台上的情境,自動進入觀眾的理解之中。這個看似與電腦無關的劇場經驗,反而讓他重新思考介面的本質。好的介面不必永遠要求人下指令;它也可以像代理人一樣,理解情境、預判需求,並在適當時刻補上資訊。這個轉折後來成為他走向情境感知介面的重要基礎。
第四個偶然,是他在 Sony CSL 之後,把電腦從螢幕帶回真實空間。他開始研究行動裝置、彩色條碼、二維標記、3D 空間中的互動,讓實體環境可以被電腦辨識,也讓人不再只是透過滑鼠與桌面視窗操作資訊。早在 1990 年代,他就已經在討論如何讓電腦增強我們與真實世界的互動。UIST 1995 收錄的研究〈The World through the Computer〉,正是這條路線的代表之一。
第五個偶然,則是特雷門琴。這種早期電子樂器靠手部接近改變電容來發聲,讓暦本教授注意到人的手勢其實可以不透過按鍵、不透過滑鼠,也能被系統感知。於是他開始用導電紙與微控制器實驗,最後發展出 SmartSkin。這套系統能感知表面上的多個觸控點,讓人用雙手直接操作互動表面。SmartSkin 論文說明,它是一種讓互動表面進行自由手勢操作的感測基礎設施;這也使後來我們熟悉的雙指縮放、平移等多點觸控手勢,有了很早期的技術雛形。
如果說 SmartSkin 是讓手指更自然地進入電腦,那麼他近年的靜默語音研究,則是讓語言與意圖更自然地進入 AI。這項研究的起點同樣來自日常矛盾。語音輸入很有效率,但在電車、咖啡店、辦公室裡大聲對 AI 說話,既尷尬、干擾他人,也可能洩露隱私。更重要的是,許多發聲困難者本來就被主流語音介面排除。SottoVoce 專案利用超音波影像與深度學習,辨識無聲發話時口腔與舌頭的動作,進而實現靜默語音互動;該研究發表於 CHI 2019,並獲得 Honourable Mention。
從光筆、歌舞伎耳機導覽、特雷門琴,到靜默語音,暦本教授給我們的啟發是:技術突破不一定來自封閉實驗室裡的線性規劃,反而常常來自一個人是否能在偶然經驗中辨識出「尚未被命名的介面問題」。這些「偶然」之所以能成為突破,是因為他從不區分「這是我的研究領域」和「這跟我無關」,而是永遠在問:「這背後有什麼有趣的問題?」因為,介面不只是工具,而是新的社會關係。人如何與資訊互動?身體如何成為輸入方式?環境如何回應我們?AI 又如何在不打斷生活的情況下,延伸人的感知、表達與思考?
這場最終講義值得推薦給關心 HCI、AI、設計、STS 與未來人機關係的朋友,讓我們一起努力,把生活中的偶然經驗,轉化成重新理解人與世界的各種可能。

Comments