人口信息冷僻字解決方案

[概述]

2003年國家信息化領導小組第一次會議決定,把電子政務建設作為今后一個時期我國信息化工作的重點,政府先行,帶動國民經濟和社會發展信息化。同時發布了《關于我國電子政務建設的指導意見》明確提出國家要組織編制政務信息資源建設專項,設計電子政務信息資源目錄體系與交換體系;啟動人口基礎信息庫、法人單位基礎信息庫、自然資源和空間地理基礎信息庫、宏觀經濟數據庫的建設。

人口基本信息庫由公安部聯合計劃生育委員會、國家稅務總局、勞動和社會保障部以及國家民政部等部委共同建造。該信息庫的核心內容將包括我國14億常住公民的姓名、性別、身份證號碼、出生年月、出生地和民族等六項基本信息。更多的信息將在相關部委的協作下在基本信息的基礎上作進一步的擴展。

由于第二代身份證采用了非接觸式集成電路,需要對全國人名、地名中的生僻字進行整理、規范,建立統一生僻字庫或擴充原有字庫,才能實現全國范圍內生僻字的存儲、讀取,因此需要對現有字庫進行擴充并提供有效的補字系統。

解決人口信息生僻字問題,需要對全國人名、地名中的生僻字進行收集整理、查重審定、建立統一生僻字庫或擴充原有字庫、編程實現。收集整理即收集整理全國人口信息中的生僻字。查重審定即各地使用的系統采用字庫不同,缺字的狀況也不同,上報的生僻字中,一部分漢字重復或在新的字庫中已經收錄,需要把這部分字刪除。擴充字庫、編程實現即將字庫中尚不存在的生僻字加入字庫,由于生僻字在目前計算機系統中沒有收錄,需要選擇編碼方案對這些字進行編碼管理。

另外,實際工作中會遇到新的生僻字,需要有高效實用的補字系統,能夠盡快補字,并能保證字體的統一性。將生僻字加入了字庫以后,還需要一種簡便易用的輸入法,讓操作人員可以方便的輸入這些漢字。

正是在這樣的情況下,北大方正公司受公安部的委托,發揮自身在中文字庫開發方面的技術優勢,將公安部從全國各地派出所收集上來的人名和地名生僻字進行整理、分析,根據人口信息系統建設的實際情況、二代身份證制證的要求和系統運行環境,制定了方正人口信息生僻字解決方案。該方案具有通用、易用和標準的特點,不僅在適合公安系統得到廣泛使用,也必將為其它行業解決生僻字問題帶來極大的幫助。

[人口信息用字方案及工作流程]

一、人口信息生僻字解決方案主要包括三個部分:

1.人口信息生僻字庫

2.配合人口信息生僻字庫的輸入法——典碼輸入法軟件

3.同步升級服務

下面分別介紹:

1. 人口信息生僻字庫

字庫由編碼方式和字符集兩部分來構成。

在人口信息生僻字庫“方正宋體-人口信息”的現有版本中,共收錄漢字75586個,包括部首329個,CJK統一漢字21003個,人口信息生僻字4776個,CJK統一漢字擴充A 6582個,CJK統一漢字擴充B 42711個,CJK統一增加漢字25個,通用規范漢字(GB18030-2005以外部分)160個。涵蓋了各地整理上報的全部地名用字、姓氏用字和使用頻度較高的人名用字。 該字庫可以在Windows2000以上的系統上安裝使用。

2. 配合人口信息生僻字庫的輸入法

人口信息用字符集需要有專門的輸入方法才能正確輸入。我們專門開發了“典碼輸入法軟件”解決這個問題。方正典碼輸入法根據漢字的部首、筆畫、筆順、筆畫數等特征作輸入漢字的檢索條件,采用交互式圖形界面,通過不斷選擇目標漢字的特征組合,最終通過鼠標點擊實現漢字輸入。這種輸入法以鼠標為輸入工具,界面直觀,對輸入人口信息用字不需要記憶任何字根或編碼,便于普通用戶的學習和掌握。

典碼輸入法是為了解決人口信息用字輸入問題而專門開發的,該輸入法是其它輸入方法的補充。用戶在日常使用時還是使用原來用慣的輸入法,只有在需要輸入人口信息用字時才調用這一輸入法,所以不會影響工作效率。

3. 同步升級服務

北大方正提供用戶與公安部在用人口信息生僻字庫的同步升級服務工作。

二、工作流程:

人口信息用字方案的實際工作流程如下圖:

三、我們還可根據客戶需求,提供針對網頁、移動端等基于在線顯示、在線輸入生僻字功能的開發方案。

陕西休彩11选5开奖查询 股票是怎么玩的 江西十一选五开奖号码 江苏7位数开奖查询 天津快乐10分开奖视频 股票配资广告 广东快乐十分钟查询结果 我要配资网 《博彩红宝典》 北京pk赛车预测软件app 陕西11选五高遗漏