本篇文章給大家談?wù)劦缘拿趾x來歷,以及姓翟取什么名字好聽的知識點(diǎn),希望對各位有所幫助,不要忘了收藏本站喔。
來源:鄉(xiāng)土人文地理 (ID:hvillage)
中國最新姓氏人口數(shù)排名——數(shù)據(jù)來源于第六次全國人口普查,由國務(wù)院人口普查辦公室統(tǒng)計。本文列出了目前中國人口最多的前十大姓和人口最多的前300名姓氏。而近幾年其他任何版本的百家姓排名,都是所謂學(xué)者研究成果,沒有調(diào)查數(shù)據(jù)做支撐。
安徽績溪胡氏祠堂
最新中國姓氏排名出爐,人口數(shù)排前十的是:
李、王、張、劉、陳、楊、趙、黃、周、吳。
第六次全國人口普查全國總?cè)丝跒?3.7億人。其中:普查登記的大陸31個省、自治區(qū)、直轄市和現(xiàn)役軍人的人口共13.4億人;香港特別行政區(qū)人口為709.76萬人;澳門特別行政區(qū)人口為55.23萬人;臺灣地區(qū)人口為2316.2萬人。
中國人口最多的前十大姓
李、王、張、劉、陳——中國五大姓人口數(shù)近4億;前十名總?cè)丝诩s為5.5億人。
1.李姓:占全中國漢族人口的 7.94% = 9530萬人。
2.王姓:占全中國漢族人口的 7.41% = 8890萬人。
3.張姓:占全中國漢族人口的 7.07% = 8480萬人。
4.劉姓:占全中國漢族人口的 5.38% = 6460萬人。
5.陳姓:占全中國漢族人口的 4.53% = 5440萬人。
楊氏祠堂
6.楊姓:占全中國漢族人口的 3.08% = 3700萬人。
7.趙姓:占全中國漢族人口的 2.29% = 2750萬人。
8.黃姓:占全中國漢族人口的 2.23% = 2680萬人。
9.周姓:占全中國漢族人口的 2.12% = 2540萬人。
10.吳姓:占全中國漢族人口的 2.05% = 2460萬人。
排行榜 第1—100名
01李 02王 03張 04劉 05陳 06楊 07趙 08黃 09周 10吳 11徐 12孫 13胡 14朱 15高 16林 17何 18郭 19馬 20羅 21梁 22宋 23鄭 24謝 25韓 26唐 27馮 28于 29董 30蕭 31程 32曹 33袁 34鄧 35許 36傅 37沈 38曾 39彭 40呂 41蘇 42盧 43蔣 44蔡 45賈 46丁 47魏 48薛 49葉 50閻 51余 52潘 53杜 54戴 55夏 56鐘 57汪 58田 59任 60姜 61范 62方 63石 64姚 65譚 66廖 67鄒 68熊 69金 70陸 71郝 72孔 73白 74崔 75康 76毛 77邱 78秦 79江 80史 81顧 82侯 83邵 84孟 85龍 86萬 87段 88漕 89錢 90湯 91尹 92黎 93易 94常 95武 96喬 97賀 98賴 99龔 100文
排行榜 第101—200名
101龐 102樊 103蘭 104殷 105施 106陶 107洪 108翟 109安 110顏 111倪 112嚴(yán) 113牛 114溫 115蘆 116季 117俞 118章 119魯 120葛 121伍 122韋 123申 124尤 125畢 126聶 127叢 128焦 129向 130柳 131邢 132路 133岳 134齊 135沿 136梅 137莫 138莊 139辛 140管 141祝 142左 143涂 144谷 145祁 146時 147舒 148耿 149牟 150卜 151路 152詹 153關(guān) 154苗 155凌 156費(fèi) 157紀(jì) 158靳 159盛 160童 161歐 162甄 163項 164曲 165成 166游 167陽 168裴 169席 170衛(wèi) 171查 172屈 173鮑 174位 175覃 176霍 177翁 178隋 179植 180甘 181景 182薄 183單 184包 185司 186柏 187寧 188柯 189阮 190桂 191閔192歐陽193解 194強(qiáng) 195柴 196華 197車 198冉 199房 200邊
排行榜 第201—300名
201辜 202吉 203饒 204刁 205瞿 206戚 207丘 208古 209米 210池 211滕 212晉 213苑 214鄔 215臧 216暢 217宮 218來 219嵺 220茍 221全 222褚 223廉 224簡 225婁 226蓋 227符 228奚 229木 230穆 231黨 232燕 233郎 234邸 235冀 236談 237姬 238屠 239連 240郜 241晏 242欒 243郁 244商 245蒙 246計 247喻 248揭 249竇 250遲 251宇 252敖 253糜 254鄢 255冷 256卓 257花 258仇 259艾 260藍(lán) 261都 262鞏 263稽 264井 265練 266仲 267樂 268虞 269卞 270封 271竺 272冼 273原 274官 275衣 276楚 277佟 278栗 279匡 280宗 281應(yīng) 282臺 283巫 284鞠 285僧 286桑 287荊 288諶 289銀 290揚(yáng) 291明 292沙 293薄 294伏 295岑 296習(xí) 297胥 298保 299和 300藺
最新全國各省市姓氏排名前10位
(一)廣東省最新百家姓排名
前十位依次是:陳、李、黃、張、梁、林、劉、吳、羅、楊。
(二)海南省最新百家姓排名
前十位依次是:陳、王、李、吳、符、林、黃、張、周、鄭。
(三)重慶市最新百家姓排名
前十位依次是:李、張、陳、劉、王、楊、周、黃、羅、唐。
(四)山東省最新百家姓排名
前十位依次是:王、張、李、劉、孫、趙、楊、陳、徐、馬。
(五)福建省最新百家姓排名
前十位依次是:陳、林、黃、張、吳、李、王、鄭、劉、楊。
(六)浙江省最新百家姓排名
前十位依次是:陳、王、林、張、李、葉、鄭、吳、徐、劉。
(七)江西省最新百家姓排名
前十位依次是:劉、李、陳、張、黃、王、吳、周、胡、徐。
(八)內(nèi)蒙古最新百家姓排名
前十位依次是:王、張、李、劉、趙、楊、郭、孫、高、陳。
(九)湖南省最新百家姓排名
前十位依次是:李、劉、陳、張、王、周、黃、楊、唐、羅。
(十)河南省最新百家姓排名
前十位依次是:王、張、李、劉、楊、趙、陳、郭、孫、馬。
(十一)北京市最新百家姓排名
前十位依次是:王、張、李、劉、趙、楊、陳、孫、高、馬。
(十二)江蘇省最新百家姓排名
前十位依次是:王、張、陳、李、徐、周、朱、劉、吳、楊。
(十三)山西省最新百家姓排名
前十位依次是:王、張、李、劉、趙、郭、楊、陳、武、高。
(十四)湖北省最新百家姓排名
前十位依次是:李、劉、張、陳、楊、胡、黃、王、徐、周。
(十五)天津市最新百家姓排名
前十位依次是:王、張、李、劉、楊、趙、陳、孫、高、馬。
(十六)寧夏最新百家姓排名
前十位依次是:王、張、李、劉、楊、陳、趙、吳、馬、孫。
(十七)遼寧省最新百家姓排名
前十位依次是:王、李、張、劉、趙、孫、楊、陳、于、高。
(十八)上海市最新百家姓排名
前十位依次是:張、王、陳、李、朱、徐、周、沈、吳、陸。
(十九)河北省最新百家姓排名
前十位依次是:張、王、李、劉、趙、楊、高、陳、馬、郭。
(二十)安徽省最新百家姓排名
前十位依次是:王、張、李、陳、劉、楊、吳、周、徐、孫。
曾氏宗祠
(二十一)新疆自治區(qū)漢族最新百家姓排名
前十位依次是:王、張、李、劉、楊、徐、吳、朱、郭、黃。
(二十二)黑龍江省最新百家姓排名
前十位依次是:王、張、李、劉、趙、孫、楊、陳、于、徐。
(二十三)四川省最新百家姓排名
前十位依次是:李、張、王、劉、陳、楊、周、黃、羅、吳。
(二十四)廣西省最新百家姓排名
前十位依次是:黃、李、梁、韋、陳、陸、楊、劉、盧、張。
壯族十大姓:黃、莫、韋、覃、農(nóng)、蒙、藍(lán)、趙、羅、梁。
(二十五)云南省最新百家姓排名
前十位依次是:李、張、楊、王、陳、劉、趙、馬、周、朱。
(二十六)貴州省最新百家姓排名
前十位依次是:王、李、陳、張、楊、劉、周、羅、吳、黃。
(二十七)陜西省最新百家姓排名
前十位依次是:張、王、李、趙、劉、馬、楊、陳、吳、郭。
(二十八)甘肅省最新百家姓排名
前十位依次是:王、張、李、劉、楊、馬、陳、趙、魏、周。
(二十九)青海省最新百家姓排名
前十位依次是:李、張、王、劉、趙、楊、陳、馬、郭、吳。
(三十)吉林省最新百家姓排名
前十位依次是:王、李、張、劉、趙、孫、楊、陳、于、高。
(三十一)臺灣百家姓排名
前十位依次是:陳、林、黃、張、李、王、吳、劉、蔡、楊。
據(jù)臺灣當(dāng)局“內(nèi)政部”最新統(tǒng)計,臺灣地區(qū)共有姓氏1989個,前十大姓氏占總?cè)丝跀?shù)的53%。
多人口姓氏分布概況(節(jié)選)
1.李姓:約占全國漢族人口的7.94%。就地區(qū)而言,李姓在北方諸省中所占比例較高,一般在8%以上。而在南方諸省中所占比例一般不足8%;尤其在東南沿海諸省中,比例僅在4%左右。
2.王姓:約占漢族人口的7.41%,人口眾多,尤以山西、河北、河南最多!
3.張姓:約占全國漢族人口總數(shù)的7.07%。尤以山東、河南、河北、四川四省為最多。
4.劉姓:約占全國漢族人口5.38%。北方地區(qū)的河北、內(nèi)蒙古、遼寧、京津地區(qū)中劉姓比率較高,約占該地區(qū)漢族人口的8%以上。
5.陳姓:約占全國漢族人口4.53%,南方地區(qū)多陳姓。在臺灣、廣東二省,陳姓約占本省人口10%以上,為省內(nèi)第一大姓。
陳氏宗祠
6.楊姓:約占全國漢族人口的3.08%,在全國分布極廣,尤以長江流域的省份多楊姓。
7.趙姓:約占全國漢族人口總數(shù)的2.29%。
8.黃姓:人口約占全國人口的2.23%。黃姓在要集中于江南地區(qū),廣東省的黃姓人口最多,約占全國漢族黃姓人口的19%。四川、湖南、廣西、江西等省黃姓人口也比較多,以上五省的黃姓人口約占全國漢族黃姓人口的56%。
9.周姓:約占全國漢族人口2.12%。在長江流域的省、市中,周姓所占比例相對其他地區(qū)要高。
10.吳姓:約占全國漢族人口總數(shù)的2.05%。江南各省吳姓均占省人口總數(shù)的2%以上,尤以福建為高,約占該省人口5%,是一個比較典型的江南大姓。
11.徐姓:約占全國漢族人口總數(shù)的1.73%。尤以河南、山東、浙江最多!
12.孫姓:約占全國漢族人口的1.52%。尤以福建、廣東、湖南最多!
孫氏宗祠
13.胡姓:約占全國漢族人口1.31%。四川、湖北、江西、安徽、浙江、山東、湖南多此姓,上述八省胡姓約占全國漢族胡姓人口65%。其中四川省約占全國漢族胡姓13%。
14.朱姓:約占全國漢族人口的1.26%。尤以安徽、江蘇、山東最多。
15.高姓:約占全國漢族人口的1.21%。尤以江蘇、福建、廣東、江西、云南等地為多。
16.林姓:約占全國漢族人口1.18%。尤以福建、廣東、臺灣三省多此姓,三省林姓約占全國漢族林姓人口60%。
17.何姓:約占全國漢族人口1.17%。以四川、廣東、湖南三省多此姓。
18.郭姓:約占全國漢族人口1.15%。河南、河北、山東、湖北、四川等省多此姓。
19.馬姓:人口約占全國漢族總數(shù)的1.05%。乃我國回族大姓。
20.羅姓:約占全國漢族人口的0.86%。其主要分布在四川、廣東、湖南、江西、貴州、湖北等省,六省羅姓約占全國漢族羅姓的70%。
21.梁姓:約占全國漢族人口0.84%。尤以廣東多此姓,約占省人口4.7%,全國漢族梁姓人口35%在廣東。
梁氏宗祠
27.馮姓:約占漢族人口的0.64%。尤以廣東、河南、河北、江蘇、山東、云南等省多此姓。
29.董姓:約占全國漢族人口的0.61%。尤以河北、山東、山西、云南、遼寧、浙江等省最為集中。
31.程姓:總?cè)丝诩s占全國漢族人口的0.57%。主要分布在河南、安徽、湖南、四川、山東等省。這五個省的程姓人口約占全國漢族程姓人口的60%。
32.曹姓:約占全國漢族人口的0.57%。尤以四川、河北、河南、湖北等省多此姓。
36.傅姓:約占全國漢族人口的0.51%。主要分布在山東、湖南等省。
37.沈姓:約占全國漢族總數(shù)的0.50%,歷代多以江南為其主要的分布地區(qū)。
39.彭姓:約占全國漢族人口0.49%。尤以湖南、四川、湖北等省多此姓。
40.呂姓:約占全國漢族人口的0.47%,尤以山東、河南二省多此姓。
42.盧姓:約占全國漢族人口的0.47%。
盧氏宗祠
43.蔣姓:約占全國漢族人口的0.47%。在我國歷史上蔣姓是一個比較典型的南方姓氏,尤以四川、江蘇、湖南、浙江等省多此姓。
44.蔡姓:約占全國漢族人口的0.46%。尤以廣東、浙江、江蘇、四川等省多此姓,四省蔡姓約占全國漢族蔡姓人口的44%。
45.賈姓:約占全國漢族總數(shù)的0.42%。尤以山西、河北、河南、四川等省多此姓。
46.丁姓:約占全國漢族人口0.42%。
地域文化的差異影響取名
百家姓是我國流行時間最長、流傳最廣的一種蒙學(xué)教材。它的成書和普及要早于《三字經(jīng)》,按文獻(xiàn)記載,成文于北宋初。原收集姓氏411個,后增補(bǔ)到568個,其中單姓444個,復(fù)姓124個。作為一本非常好的閱讀材料,我們可借此了解百家姓的起源與其深遠(yuǎn)影響。推薦大家閱讀。
除了姓氏之外,人名也挺有意思。借助公安部“全國公民身份信息系統(tǒng)”,對中國公民的名字進(jìn)行了統(tǒng)計。顯示,中國人名呈現(xiàn)明顯的北“硬”南“軟”地域特點(diǎn)。按照統(tǒng)計結(jié)果,中國人的姓名均有所在地區(qū)的特點(diǎn),而這些姓名的常用字,也會因地區(qū)的不同而有差別。
比如,北京,排在北京市前五名的姓氏依次是王、張、李、劉、趙。最大姓氏是王,占到總?cè)丝诘?0.35%;其次是張,占9.4%;第三位李,占8.54%;劉姓占6.91%;趙姓占3.45%。
上海市戶籍人口中叫“陳潔”的最多,共有3937人;排在前10位的姓名依次是:陳潔、張敏、張偉、張燕、王秀英、張秀英、張磊、王偉、陳燕、王芳。上海市戶籍人口中最大的姓氏為“張”姓,共有89.68人,排名前10位的姓氏依次為:張、王、陳、李、朱、徐、周、沈、吳、陸。上海的常用姓名和杭州、南京十分接近,潔、敏、燕、芳、萍等字在這三個城市的使用都很頻繁。
南北東西的文化差異也能在姓名上體現(xiàn)出來。比如,北京人女性多以靜為名,哈爾濱人女性多以淑為名,這些字與江南城市相比略顯剛強(qiáng)。在廣州,常用姓名則表現(xiàn)出粵文化的特質(zhì):受港臺文化影響很大,特別是商業(yè)氣氛帶來了入世精神,廣州前十名依次為陳志強(qiáng)、黃志強(qiáng)、李志強(qiáng)、陳偉強(qiáng)、陳俊杰、陳妹、梁妹、黃俊杰、陳志明、陳麗華。志強(qiáng)、俊杰等詞匯,少了江南城市的清麗,多了幾分自我自強(qiáng)的精神,而妹字的使用則帶有當(dāng)?shù)胤窖缘纳省?/p>
姓名排行前三名:張偉、李偉、劉偉
從全國31個省會市、直轄市的姓名統(tǒng)計情況來看,前10名中兩字名居多,主要也集中在姓氏統(tǒng)計中王、張、李、趙、劉等“大姓”之中。在31個城市中“張偉”位居榜首,2億人中共有59275個張偉,“王偉”、“李偉”與“劉偉”分別為2、3、4名。前4名的姓名中“名”全是“偉”字,可見中國百姓在起名時對“偉”字情有獨(dú)鐘。
在成都,人們起名字好像更加偏愛勇字,排在前10名的姓名中有5個名字都是以“勇”作為名,成都人在起名字時把一個“勇”字用到了極致,排在前10位的其他姓名,也是以強(qiáng)、敏、偉、靜等反映人們品質(zhì)的字作為名字。與成都相鄰的貴州也有這樣的特點(diǎn),前十位都是兩個字的,且分別有五個名字都是以“勇”作為名字。
由于文化不同,昆明人姓名則表現(xiàn)出截然不同的信息。昆明市排名前十位的姓名中有七個都是三個字的名字,“秀英”“桂英”等反映女性優(yōu)秀品德的名字在同名同姓現(xiàn)象中還占有重要的地位。
綜合來看,西南地區(qū)城市同南方的廣州、南寧、海口的同名同姓現(xiàn)象差別較大,反映出較為明顯的地區(qū)差異。
編輯:馬秀秀
中國姓氏中有個有趣的現(xiàn)象,某個字被當(dāng)作姓時,讀音就會發(fā)生變化,你千萬不能按普通話的讀音去矯正,姓氏讀法應(yīng)按祖輩傳下來的音去讀。比如這5大姓氏,一半人都讀錯了!
1、時
時間的時,并不是一個多音字,但是作為姓氏,要讀作chí,第二聲。時姓是春秋時期楚國大夫申叔時之后,如果你聽到某地人讀shí,那么這部分姓氏的人就是假姓,他們是春秋時宋國一個大夫來的后代,結(jié)果把姓氏讀錯了,以為是時間的時,成了山寨版的。
2、令狐
令狐這個姓氏99%的人都會讀錯,都是受了笑傲江湖令狐沖的誤導(dǎo)。正確讀法是líng hú而非lìnghú。令狐姓出自地名,發(fā)源于山西,現(xiàn)在的令狐姓氏大多被改成了令。全國令姓的祖上都是令狐。
3、任
任姓是又一個被笑傲江湖誤導(dǎo)的姓氏:(rèn)任我行、任盈盈。但是做姓氏時正確讀音是rén(二聲):任長霞。任姓的祖上來源比較多,有正宗任姓,也有其他姓氏改過來的。
4、解
解是個多音字,jié和xiè,但是作為姓氏時,必須讀作xiè或者h(yuǎn)ài,并沒有jiě姓。解氏最早源出于姬姓。周朝時周武王有個兒子叫作唐叔虞的,是周成王的弟弟,他的兒子中有一個叫良的受封于解地(今山西解縣),稱為解良。解良的后代在解地世代定居,以地名解為氏。
5、翟
翟是多音字,dí和zhái,作為姓氏時,只能讀作zhái,中國并沒有dí姓。雖然翟姓來源較多,但所有的分支都讀做zhái,讀dí的要么就是讀錯了,要么就是跟時一樣是其他姓山寨過來后讀錯了的。
您的姓氏是多音字嗎?又或者并非多音字但是做姓時讀法不一樣的?請留言。
豬年女孩起名:
【千雅】
名字出自宋?王炎?《念奴嬌(菊)》--“ 因念愛酒淵明,東籬雅意,千載無人續(xù)”
字義千:意為極多;雅:意為高雅;
【如倩】
名字出自宋?張潞?《張潞祝英臺近(木稚)》--“何如倩取西風(fēng),吹將歸去,為添在、廣寒宮里”
字義如:意為依照、比得上;倩:意為美麗;
【青珍】
名字出自明?于慎行?《戊寅正月上尚巾禮成群臣稱賀賜白金文綺》--“邇臣幸奉青蒲對,珍賜還看出上闌”
字義青:意為青色、意為永葆青春;珍:意為貴重的、珍惜、珍愛;
【宣伊】
名字出自明?任瀚?《留別岐州翟千戶》--“玉關(guān)許割桓伊郡,宣室難容賈誼朝”
字義宣:發(fā)表,公開;疏通,泄漏;發(fā)揚(yáng),廣泛傳播;通,暢達(dá)。;伊:
【清玉】
名字出自成語--“玉潤冰清:像玉一樣潤澤,像冰一樣清純。常喻人或物形神之美?!?/p>
字義清:意為純凈、透明;玉:比喻潔白、美麗;
簡單洋氣的女孩名字:
【嫣然】:嫣表示美好、美麗、嫣然;然表示信守、合適、巍然。
【弘雅】:弘表示光大、廣大、弘道;雅表示美好、高尚、雅靜。
【可昕】:可表示合意、適合、能夠;昕表示明亮、黎明、昕旦。
【珊琪】:珊表示珍奇、珊瑚、珊珊;琪表示美玉、珍異、琪琚。
【依萱】:依表示依戀、依心、依信;萱表示萱草、紫萱。
貝貝調(diào)侃自己是一個「生僻字患者」。她的名字左邊一個王,右邊一個瑩,意為「光潔像玉的石頭」。在數(shù)字世界,這卻是一個無法被計算機(jī)語言識別的生僻字,常常被顯示為一個問號或者白色方塊「?」,有時只能改用拼音「yíng」。
麻煩從未停止過。在買一根大蔥都能掃碼支付的時代,名字有生僻字的她,無法完成實(shí)名認(rèn)證,是一個被線上支付隔絕在外的人。微信搶紅包的熱鬧,支付寶、微信支付的便捷,在 2022 年 1 月 28 日之前,她都未曾體驗過。
這樣的權(quán)利是通過反復(fù)多次,長時間地溝通才重新找回的。貝貝一邊找支付寶、微信客服反饋,一邊找人民銀行監(jiān)管投訴尋找解決方案。最后通過綁定 3 個賬戶姓名一致銀行卡的辦法,才終于「變成了正常人」。
她把經(jīng)歷發(fā)在社交平臺,2 年里,陸陸續(xù)續(xù)有相似經(jīng)歷的人和她互動。有相同困擾的人不在少數(shù),據(jù)統(tǒng)計,名字中有生僻字的人大概有 6000 萬。背后的原因是:在電子設(shè)備上可以無障礙使用的常用漢字大概在 3 萬左右,也意味著,有超過 70% 的漢字被排除在數(shù)字世界之外。
這些生僻字往往暗藏著最初起名時,對人希望的寄托。被最多人提到的「由頁」是美好,「華韋」是光亮,?意為「飛龍在天」。但在數(shù)字化越是深入的地方,這些寓意美好的生僻字帶來的困擾就會越多。
從出生前在醫(yī)院建檔案,到上戶口,辦理身份證,銀行卡,醫(yī)院掛號,再到保研時信息錄入學(xué)信網(wǎng)、玩游戲時的實(shí)名認(rèn)證、乘飛機(jī)在線選座……有一個有生僻名的名字,生活中的困難幾乎會伴隨一生。一些人被迫改名、換姓。
在數(shù)字化時代,生僻字困擾的不止是人,還有地。有生僻字的地名,因為無法正常輸入、顯示而徹底消失在電子地圖上。山東省濰坊市奎文區(qū),在元明更替之際就已經(jīng)存在的「貝亅 (zhī)」?fàn)柷f,就因為生僻字問題,兩度更名,一開始叫則爾莊,后又在 2019 年更名為芝爾莊。存在 600 余年的「貝亅」就這樣消失了。
中國從 1974 年,開始源源不斷地幫助漢字「上網(wǎng)」,最先在計算機(jī)語言中通行的,是只有 26 個字母的英文,但漢字是表意文字,只有將字、形狀、編碼,三者一一對應(yīng),一個漢字才可能出現(xiàn)在數(shù)字世界。當(dāng)編碼或者字形不被系統(tǒng)所支持時,就成了數(shù)字世界的「門外漢」,被歸類為生僻字。
除了讓漢字有統(tǒng)一的編碼之外,它仰賴輸入法、手機(jī)廠商、APP 制造商的一套完整且成規(guī)模化的體系。生僻字帶來的問題,很難依靠市場的商業(yè)選擇而解決,「很少人會為了輸入或者顯示輸入法而買單」。
50 年時間過去,變化正在發(fā)生。越來越多漢字擁有了數(shù)字世界的「身份證」,2022 年 7 月 19 日,國家市場監(jiān)管總局批準(zhǔn)發(fā)布《信息技術(shù)中文編碼字符集》(GB 18030-2022 國標(biāo)),收錄的漢字已經(jīng)達(dá)到 88115 萬個。這其中,最重要的更新就是收錄了公安人口信息專用字庫新增的 614 個漢字。
今年 8 月開始,這將會作為強(qiáng)制性國家標(biāo)準(zhǔn),政府服務(wù)和公共服務(wù)的信息產(chǎn)品都必須執(zhí)行這一標(biāo)準(zhǔn)。而在這之前,這是一個很難衡量得失的產(chǎn)品改進(jìn),在做任何選擇都要更考慮投入產(chǎn)出比的今天,一群人正在努力拉回這些被落下的名字。
01 一個名字帶來的難題
云南麗江永勝縣的一個傈僳族村子里,一群姓「鴨」的人最懂得生僻字為生活帶來的苦楚。
在更換第二代身份證時,原本姓「nia」,字為「上鳥下甲」姓的村民們,集體將姓氏換成了鴨。
傈僳族有氏族文化,「nia」在他們的語言中,是鳥的意思。但曾經(jīng)靠手寫傳承的氏族之名,在電腦系統(tǒng)中無法輸入,讓他們遭遇了辦證件、出行、求學(xué)的困難。全村 700 多人,集體改名,姓「鴨」。
從那之后,這個有氏族文化的民族,姓氏就從天上飛的鳥,變成了地上跑的鴨。人們甚至找不到這個姓氏更改的由來,誰做的決定,誰定下了「鴨」這個字。在數(shù)字化升級的過程中,他們的名字被落下了。
一位村民提到了他們對此仍有避諱,不愿意讓孩子繼續(xù)姓「鴨」。
在越是信息化、數(shù)字化的時代,生僻字帶來的難處就更加明顯。
一位從英國回國的女生,因為名字中有生僻字無法輸入,申請不到健康碼,反復(fù)給大使館打電話希望能特殊處理?;貒?,無法實(shí)名做核酸檢測也成了問題,最后跑了上海的四五家醫(yī)院,才通過手填的方式才做上了當(dāng)時隨便在小區(qū)樓下就能做上的核酸檢測。這次的困擾之后,她果斷改掉了名字。
一部分人選擇死磕。貝貝不愿意改名,但名字無法輸入的問題必須要解決。
知道癥狀出現(xiàn)在哪里,貝貝就成了這個名字的專業(yè)「醫(yī)生」。她幾乎可以反射性地告訴同樣因為這個名字而困擾的人,在各個場合輸入「ying」字的訣竅:身份證 U+E362、安卓 U+2C386、搜狗輸入法 U+E052。
這是她長期通過各種渠道反饋,才終于贏回來的名字。甚至在哪些銀行,這個名字能通過什么方法辦下銀行卡,她也門兒清。名字同樣有「王瑩」的一位女生,至今都只能綁定父母的信息,才能正常使用微信。
侯先生名字有「?」字,他能使用的銀行卡只有兩張,一張靠拆字,一張靠拼音,「只能祈禱別出什么幺蛾子?!?/p>
也有人未能掌握要領(lǐng),打不出自己的名字。只能在互聯(lián)網(wǎng)上求救。用最原始的辦法,讓別人先用可以輸入的鍵盤打回來,再進(jìn)行復(fù)制。而在多數(shù)需要人臉識別的場合,他們多數(shù)情況會被攔住,向各種工作人員一遍遍解釋。
蔣燡出生于 70 年代,在越來越多手機(jī) APP 都需要實(shí)名認(rèn)證的今天,生僻字帶來的麻煩越來越大。
她曾遇到過在醫(yī)院看病,門診收費(fèi)處可以打出名字,但醫(yī)生的問診系統(tǒng)卻沒有的情況。交得了錢卻看不了病,得不到檢查報告。這背后的問題是,即便是在同一個體系,使用的程序有差別,生僻字也照樣會帶來問題。
「數(shù)字化都已經(jīng)很發(fā)達(dá)了,打出這個字不應(yīng)該是一個很復(fù)雜的問題,畢竟科技在發(fā)展,生僻字不應(yīng)該成為一個難題?!故Y燡說。
02 生僻字到底難在哪里?
讓生僻字能被輸入和顯示,無障礙地穿梭于數(shù)字世界,需要依賴多方的意識與決心,也是一場不能以商業(yè)收益衡量的共謀。
一個生僻字變成「正常字」,從被找到,到考證、賦碼、擴(kuò)容國標(biāo)、字形設(shè)計、再到最終的推廣應(yīng)用,中間是漫長的過程。只有從工信部電子工業(yè)標(biāo)準(zhǔn)化研究院、字庫廠商、輸入法、手機(jī)廠商,APP 制作方等軟硬件廠商,中間各方徹底地打通,才有正常輸入、顯示生僻字的可能。
有時,生僻字只是被阻攔在賦碼環(huán)節(jié),都會折損大量的時間。
工信部電子工業(yè)標(biāo)準(zhǔn)化研究院中文信息研究室主任黃姍姍長期在跟漢字打交道,她說,一個字的編碼依賴于國際標(biāo)準(zhǔn)化組織 ISO/IEC 10646 的工作,他們會對全世界各國提交的所有漢字進(jìn)行統(tǒng)一編碼,涉及不同國家之間的漢字細(xì)微差異和連接認(rèn)同與查證,因此,生僻字賦碼的過程非常復(fù)雜且漫長。
每年中國提交的漢字都在 1000 字左右,而負(fù)責(zé)給漢字編碼的國際標(biāo)準(zhǔn)化組織,每年工作組只開兩次會,「這次無法解決的問題就留到下次」。這就導(dǎo)致,一個漢字從提交到最終獲得國際標(biāo)準(zhǔn)化組織認(rèn)定的編碼,基本都需要 4 至 5 年的時間。
生僻字編碼的過程是漫長的,但用字的需求隨著數(shù)字化的到來卻更加緊迫。
搜狗輸入法生僻字項目負(fù)責(zé)人辜海玻記得,他們撥通蔣燡電話時,她在電話的那頭哽咽了,她覺得自己的需求受到了重視,問題有了被解決的可能性。
去年 11 月,搜狗輸入法中新增了「生僻字征集」功能,希望征集在 8 萬字新字庫基礎(chǔ)上,仍然無法打出來的生僻字。蔣燡迫切地希望新的公共字庫中,能增加自己的名字,分別在第 1457、5528、7327 次重復(fù)提交了這個字。
她遇到的問題中,最顯著的就是跨系統(tǒng)使用的障礙。盡管在公安、社保系統(tǒng)中,蔣燡的名字已經(jīng)能顯示,但在其他場合,例如銀行、醫(yī)院,這仍然是一個生僻字,無法通用。有一家銀行曾經(jīng)多次給她打電話說,銀行已經(jīng)能打出她的名字,但她不敢用,也不敢改,因為她擔(dān)心這會打破現(xiàn)在的平衡,反而讓要給她匯款轉(zhuǎn)賬的人無法繼續(xù)正常使用。
受限于這樣的機(jī)制,標(biāo)準(zhǔn)化研究院也在考慮,通過自主性更強(qiáng)的國家標(biāo)準(zhǔn),先收錄漢字解決未來的問題。
本質(zhì)上,兩者技術(shù)上工作并無大的差別。但新提交的生僻字有了一個更快速的響應(yīng)流程,涉及到急用的人名、地名等,通過數(shù)據(jù)考察和有實(shí)際應(yīng)用需求的漢字就會更早通過國家標(biāo)準(zhǔn)先流通起來。時間也能縮短到 2-3 年,甚至更短。
根本上,生僻字的問題要徹底解決,跨系統(tǒng)的顯示才是棘手的問題。一部分機(jī)構(gòu)為了解決用戶的困擾,會通過不同的編碼來登記名字,但這帶來的問題是,一旦涉及到聯(lián)網(wǎng)環(huán)節(jié),又會造成一個接一個的差池。
從今年 8 月開始,隨著將會強(qiáng)制執(zhí)行新標(biāo)準(zhǔn),過去各方落下的功課,也需要快速補(bǔ)足。建立統(tǒng)一的標(biāo)準(zhǔn)只是解決生僻字問題的第一環(huán)。
據(jù)不完全統(tǒng)計,漢字的總數(shù)約為 10 萬個,其中仍有許多生僻字尚未被編碼,但具有實(shí)用價值。數(shù)字世界的漢字從 3 萬到 8 萬,花了 50 年,而之所以從規(guī)則人要求把生僻字重新?lián)炱饋?,大擴(kuò)容,本身也在為了避免過去被忽視的生僻字會從「罕用」變成「不用」。
03 商業(yè)公司并不商業(yè)的選擇
「適配需要成本,大家都不動,這件事就沒有實(shí)現(xiàn)的可能」,搜狗輸入法 2022 年去尋找廠商合作時,吃到了不少的閉門羹,「這不是我們 KPI 里最重要的事」。
盡管生僻字影響著 6000 萬人的生活,但解決生僻字問題,卻幾乎帶不來任何的商業(yè)利益。在互聯(lián)網(wǎng)公司都在「降本增效」時,生僻字的改造很難被劃在優(yōu)先級更高的位置。
而此時,生僻字在搜狗輸入法內(nèi)部,已經(jīng)與無障礙化的改造劃上了等號。搜狗輸入法 CEO 魯劍告訴極客公園,從 2023 年開始,公司的 OKR 里面除了用戶增長和商業(yè)價值之外,多了一項「社會價值」。
事實(shí)上,搜狗輸入法至今一直處在虧損狀態(tài)。「在騰訊內(nèi)部做一個虧損產(chǎn)品,確實(shí)是有壓力的」,魯劍說。但好在,過去搜狗輸入法做的通過眼睛控制輸入的眼動儀,2022 年搜狗輸入法重投入的「眾聲無障礙計劃」,在社會價值層面都有其回報,也契合近幾年騰訊力求的,投入更多錢做更多有社會價值的貢獻(xiàn)。
這些支撐搜狗輸入法去做市場上第一家快速響應(yīng)投入到解決生僻字問題的商業(yè)公司。而隨著新中文編碼字符集將在今年 8 月 1 日開始強(qiáng)制執(zhí)行,生僻字的解決開始變成一件「不得不」解決的問題。
從解決編碼到讓各個場景都支持,這是一條走了很久的路。
一群以商業(yè)銀行、相關(guān)政府機(jī)構(gòu)、微信支付寶相關(guān)人士,受生僻字所困擾的普通網(wǎng)友共同創(chuàng)建了的「生僻字交流群」。群從 1 個擴(kuò)散到兩個,如今已經(jīng)超過 700 人,他們在群里提供盡可能的幫助,從各個平臺如何解決生僻字認(rèn)證,到具體的生僻字編碼,在處理各類公共事務(wù)時可以采取的方法,在這里,可以圍觀到「一個普通人因為生僻字導(dǎo)致的充滿麻煩的一生」。
事實(shí)上,系統(tǒng)對字符的支持分為數(shù)據(jù)庫和客戶端,能輸入?yún)s未必能顯示。騰訊搜狗輸入法早在 2021 年 11 月就上線了「生僻字鍵盤」,這個特殊的輸入法擁有筆畫、拼音、「拼音+筆畫」三種輸入方式,幫助生僻字都能被打出來。但在不同的手機(jī)系統(tǒng)、電腦系統(tǒng),甚至不同的 APP 中,顯示仍然是一種麻煩。
讓生僻字顯示,手機(jī)廠商起至關(guān)重要的作用。魯劍舉了一個例子,集成生僻字雖然不會影響手機(jī)的運(yùn)行,但假設(shè)字庫分別搭載在各個手機(jī)軟件中,一個 10M,100 個手機(jī) APP 就會用掉 1 個 G,字庫占據(jù)的內(nèi)存就會指數(shù)級增加;但假設(shè)是廠商接入,那各個產(chǎn)品就可以直接調(diào)用廠商字庫,「廠商一旦適配,下面的各個應(yīng)用的適配就水到渠成,產(chǎn)生多米諾骨牌的效應(yīng)。」
但問題仍未被完全解決。在未能有統(tǒng)一的國家標(biāo)準(zhǔn)時,「一字多碼」的狀況層出不窮。在不同系統(tǒng)之間,統(tǒng)一生僻字的代碼一旦不相同,仍然會出現(xiàn)無法顯示的問題?!竿醅摗乖谒压份斎敕ㄊ褂玫?PUA 碼與戶籍系統(tǒng)仍不相同,PUA 碼(Private Use Areas)是解決未被 Unicode 標(biāo)準(zhǔn)收錄文字,在某些特定場景使用文字的一種方法,搜狗輸入法、乃至戶籍管理系統(tǒng)中,都存在這樣的 PUA 碼。這樣的狀況同樣需要時間去一一解決。
另外,8 萬字的新標(biāo)準(zhǔn)還未能囊括全部的漢字。2023 年 4 月 20 日,騰訊聯(lián)合工信部電子工業(yè)標(biāo)準(zhǔn)化研究院等發(fā)起的生僻字征集小程序,第一天就收到用戶提交生僻字 1404 個。提交次數(shù)最多的是陜西知名的 biangbiang 面,有些人用手寫,有些靠拍照,更多人參與進(jìn)來試圖讓更多漢字留在中文數(shù)字世界。
這些都是問題正在被解決的信號——很多人也都不再需要主動或者被動地?fù)Q掉名字。曾頔初中升高中時,正值全國統(tǒng)一更換戶口本。工作人員找不到「頔」,就打成了「碩」,直到中考前夕這個錯誤才被發(fā)現(xiàn),「差點(diǎn)耽誤了高中升學(xué)」。折騰許久,換回來后,她的戶口本上就多了一個她從未用過的曾用名:曾碩。
工作時她也有一個「替代名」,單位打卡機(jī)上也找不到頔,她只好選取別的漢字代替,胡亂選了「曾翟」,這個名字陪她打了四年卡。8 月新標(biāo)準(zhǔn)強(qiáng)制實(shí)施后,意味著生僻字問題有了第一條休止線,在數(shù)字化的世界中,像曾頔一樣的人找到自己的名字未來就不再是問題,也不應(yīng)該是問題。