在很多英文論文里,遇到「f」和「i」相鄰的情況時,會用「?」(注意這不是 f 和 i 的組合,而是一個字元)這個字元代替。請問這個字元有什麼說頭嗎?


這個「?」叫「ligature」(連字),一般出現在拉丁字母 f 和 i、j、l 等字母相鄰的情況下。這些字母相鄰的時候,f 上面那個鉤會和後面的字母筆畫衝突,活字印刷的時代,就單獨鑄一個「?」這樣的鉛字塊(如下圖,圖片來自維基百科),這樣可以使效果更美觀。如果要求更高,還可以單獨鑄更多的 ligatures。比如「ff」、「ffi」、「ffl」等等。

其實我們常用的「」符號也是一個 ligature。它是拉丁字母中「Et」的 ligature,et 在拉丁語中就是 and 的意思。

電腦時代這些 ligatures 保留了下來,在 Unicode 中有專門的字元(character)。關於其他語言的連字現象和電腦排版工具,字體是怎麼處理連字的,另請高人回答。

參考:http://en.wikipedia.org/wiki/Typographic_ligature


以下補充 @梁齊齊 的答案:

「?」的確是個連字(ligature),「」也是。不過也應當了解,「?」和「」不是同一類的連字。「?」僅僅是字體、排版層面的,而「」是語義、文字、書寫系統層面的。「f」和「i」這兩個字母放在一起時,連或不連,通常不影響語義,僅僅是視覺樣式的問題;而「」和「et」的意義不同。

原則上,其實「?」這個連字對讀者應當是透明的——不應當讓讀者意識到文件中因為排版手法而把兩個字元的兩個字形(glyph)合併成一個字形來顯示,讀者不需要關心排版,讀者只需要了解文本內容。
Unicode 為 ?、?、? 等排版層面的連字字形單立字元(character)[1],主要是為了向後兼容一些遺留字符集。寫作時沒人會用這些字元,也不應使用這些字元。如果需要連字,應該輸入常規的分離字元,交由排版引擎自動生成連字。

在 PDF 文件里選中文本時看到它們是獨立的字元並且複製時常常還複製出「!」之類莫名其妙的字元,是因為 PDF 把它視作獨立的字元來繪製 [2]。
只要字體支持,並且排版引擎啟用了連字,那麼輸出的 PDF 中,「fi」就會變成一個連字。LaTeX 和 InDesign 輸出的 PDF 中都很常見。

合格的 PDF 閱讀器(比如 OS X 的 Preview.app)在文本操作時(比如搜索、複製)都會把連字正常化為常規的、字母和字母分離的字元串來處理。

[1] Unicode 中的連字字元: http://www.unicode.org/charts/PDF/UFB00.pdf
[2] PDF 繪製連字的機制:

上圖為一個 PDF 頁面中的一處「?」連字,相關的繪製語句如下:

5 (s) -8 (en) 19 (t) -5 (i) -3 (a) -5 (l) -5 (l) 7 (y ) -73 (co) 12 (n) ]
TJ ET BT 10.2 0 0 10.2 254.5086 295.1315 Tm /Tc2.1 1 Tf (#) Tj ET BT 10.2 0 0 10.2 259.9656 295.1315
Tm /Tc3.0 1 Tf [ (n) 4 (e) -5 (d ) -73 (t) 6 (o ) -73 (t) -6 (h) 4 (e ) -73

可以看到這麼一段:

… (co) … (n) … (#) … (n) … (e) … (d ) …

這裡就是在繪製「confined 」,其中「#」就是「?」。
這個 PDF 文件另外一處有一個僅包含4個連字的字體子集,定義了「#」和「?」的轉換關係。


字體裡面的話……

sub f i by fi;


小林章《西文字體》裡面提到過如果羅馬正體裡面f後面直接跟著i的話,f的一彎和i的點點會產生「難看的黑塊」,ff、fl、ffi、ffl同理,所以在活字時代就有這五種合字,現代電腦字體也因同樣原因會在排版時用這種合字。

他好像還提到過,如果是一些專門為德語設計的字體的話還會考慮fb、ft等等這種合字,所以在這裡提醒一下學過德語的各位強迫症患者╮(╯_╰)╭


補充一點,在論文裡面看到大量的連字是因為國外的學術論文大量都是用LaTeX排印的,LaTeX會自動連字ff和fi


推薦閱讀:

《獨唱團》的字體排印與裝幀設計方面有哪些值得學習或有待討論的地方?
在現今,最能代表中國的是哪種字體?
字數多的海報如何設計才能搶眼?
為什麼像 Pocket、Instapaper、Readability 這些簡潔、純粹的閱讀工具卻沒有兩端對齊?
寫文章時段首空兩格是從何時開始的?為什麼這樣設計?

TAG:字體排印 | 連字ligature |