笑言自己大半生走不出馬料水(中大)的李丹1984年經一年制預科高等程度會考 (High Level )入讀中大,一年後由數學系轉修電子工程,「我一路相信數學好,甚麼都會好。我好欣賞讀數學的人,譬如梁迺聰,好聰明,他當年大學都未畢業,已經跟丘成桐 (知名數學家)讀數。」儘管心愛數學,惟始終比同屆同學少一年讀書經驗,他形容自己大一成績「慘敗」,促使他後來說服系主任讓他轉讀較為「實在」的電子。
「大學畢業之後讀碩士研究生,之後去城大,當時叫城市理工做教學助理。」在即將完約之際,他萌生繼續讀博的念頭。巧合在火車站遇見程伯中和陳麗雲兩位中大教授,得知對方正開展廣東話的語音識別項目,於是自動請纓加入其團隊,「1992年開始在中大讀博士。」對於人名、年份,他一下子就準確說出,記憶力過人。
雖然語音識別是由電腦處理,然而作為研究員,亦不可以沒有語言學根底,「當時對於廣東話語言學,我一竅不通,於是去找徐雲揚教授學,他是人類學出身,但教phonetics (語音學)。我跑去城大跟他學, 聽他的seminar,但是很沒有系統地學。」
「初時學廣東話拼音,但廣東話拼音並沒標準寫法。雖然學術界用粵拼,但民間又不跟隨。」他舉例指,香港人的中文姓氏即使相同,但英文拼寫花款各出。「例如徐雲揚教授,他英文名是Eric Zee,不是現在常見的Tsui。姓蔡的可以有Choi、Tsoi, Choy…『張』可以是Cheung或 Chiang。」這種現象是殖民地時期遺留下來的。
「以前香港人去到出生登記處,用他最可能最準確的發音講出名字,職員經過受訓有一套系統去拼寫,但系統並不一致,於是出現不同寫法。」他後來又學習國際音標,「所有語言通用的,我要識囉。」
學好音標,再學廣東話,或者可以減少鬧出笑話。
「長aa定短a,可以有好大分別,例如「劉」同「撈」、「快」同「廢」。你有沒有聽過一個洗衣機的笑話?有個客人到洗衣店,跟店員講,這件衫咁樣「死」得,掉返轉「死」又得,咁樣「死」都得。這個就係ei (死)同 ai (洗)的分別。」