時間:2023-08-21 17:22:48
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇中小學人工智能教育,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
人工智能技術及其應用的發展歷史雖然只有短短的50余年,但是它作為信息技術的前沿領域,對社會經濟和發展的影響卻越來越大。在基礎教育課程改革的大潮中,許多國家意識到基礎教育領域開展人工智能教育的必要性,努力把人工智能列入技術類教育的教學內容中。作為師范類院校,教授人工智能課是有必要的。?
(1)為部分優秀的學生將來做更深入的研究打堅實的基礎。在面向知識經濟的今天,研究獲取、表示和使用知識的人工智能學科越來越受到人們的重視。目前人工智能研究被列為中國高技術領域的重點之一。以專家系統為代表的智能化系統在信息技術中也占有重要地位。因此在高等教育中開展人工智能教育和智能化系統的研發,不僅是計算機科學的應用,也是促進各學科服務于國民經濟發展的必然趨勢。為使人工智能的理論、方法和技術的研究與應用普及和深入,教育重心必須要下移,即從研究生教育向本科教育普及。開展本科層次人工智能普及教育的有效途徑之一是在本科高年級開設相關選修課。開展人工智能教育,不僅能夠更好地發揮高等院校的育人和科學研究功能,而且能為學生拓寬專業路徑,擴大自主學習空間和發展個性創造條件,同時也為營造一個使學生不僅有寬厚、扎實的理論基礎,且具綜合分析和解決問題能力的環境。?
(2)為將來從教的學生積聚大量的知識。英國早在1999年,人工智能課程已經作為選修課出現在中學的信息與通訊技術(ICT)課程中。許多中小學還通過機器人競賽活動來激發中小學生學習人工智能的興趣,使學生不僅提高了用信息技術解決問題的能力,而且培養了多種思維方式,獲得了更多的創新空間。美國現行的中學信息技術課程設置中,將人工智能的內容作為“媒體與技術”層面對12年級學生的要求。澳大利亞的部分中學開設的信息處理與技術課程,人工智能、信息系統、算法和程序設計、社會和倫理道德、計算機系統分別作為5個主題共同構成了該課程的教學內容。在該課程的大綱中規定,人工智能部分的教學內容在高中第3學期為12年級的學生開設,教學時間為10周。?
在我國,多年以來中學奧林匹克信息學競賽中一直包含有人工智能相關的題目,涉及啟發式搜索、博弈、智能程序設計等問題。2003年4月,我國教育部正式頒布《普通高中技術課程標準(實驗)》,首次在信息技術科目中設立了“人工智能初步”選修模塊,標志著我國高中人工智能課程的正式起步。?
我國的新課程標準頒布后,教育部評審并通過了分別由教育科學出版社、廣東高教出版社、地圖出版社、上??萍冀逃霭嫔绾驼憬逃霭嫔绯霭娴?套高中《人工智能初步》教材,并開發了相應的教輔材料,包括教師用書和配套光盤等。為了配合中學人工智能課程的實施,國內也推出了一些適合中學生學習與體驗的人工智能軟件和網絡資源。另一方面,一些高校的本科生、研究生也逐步關注中學人工智能教育的開展并將其作為畢業論文的研究選題。一些師范院校適應形勢要求,已為師范生開設了與此相關的選修課程。?
2 人工智能的教育及教學條件現狀?
通過對本人多年的教學過程進行總結,我校的《人工智能》課程教育現狀可總結為如下幾點:?
(1)理論知識充裕。但與實踐相脫節,特別是在智能科學技術的教育教學方面。盡管知識面相當廣泛,而人工智能理論的普及教育以及智能技術的開發與應用仍然十分滯后。?
(2)同其它普通高等院校一樣,在本校,人工智能技術的研究與應用尚未普及,甚至比不上其它院校。這不利于培養學生的科研興趣及創造精神。?
(3)缺乏配套實驗教材,實驗教學內容缺乏,無法培養學生的研究能力和創新能力。只有開設實驗項目,才能使人工智能的相關知識具有研究性和綜合性。?
(4)對中小學智能教育的深度及教學方式、教學特點缺乏研究。做為師范類院校,我認為在對學生進行基礎知識教育的基礎上,要緊抓中小學智能教育的特點對師范類學生進行相關的教育與培訓。?
相對于教育現狀,我校的《人工智能》課程教學條件現狀要稍好一些,其狀態如下:?
(1)教材使用國家級規劃教材,此教材非常系統地介紹了人工智能的基本原理、方法和應用技術,適合本科及研究生使用。在我們的授課過程中,也會適當為學生提供相關的國內其他先進教材,如中南大學蔡自興教授的《人工智能及其應用》等。?
(2)為了促進學生自主學習,我們準備了多種類型的擴充性學習資料,加強學生主動學習的意識,包括:課程相關雜志和書籍目錄,以及部分重要的參考文獻,與人工智能相關的網絡資源如優秀BBS、新聞組、網址等。 它們包括了大量的文獻資料、本領域研究的前沿動態等。 使用表明,學生非常樂于查閱這些資源。 使學生能通過使用這些資源進行一些人工智能程序設計,探討一些問題,在課堂討論中展示他們的收獲。?
(3)校園網的普及與不斷優化使本課程有優良的實踐性教學環境,能充分滿足教學需要。我們擁有較充足的多媒體教室和網絡教室,為實現本課程教學提供了物質保障。在網絡資源建設方面,全校辦公室、教室、學生宿舍和教師宿舍都以寬帶網相連,這些硬件設備對本課程教學發揮了重要作用,使本課程教學質量得以明顯提高。?
3 人工智能教學方法及手段的改革?
針對我們現在所采取的教學方法,我認為存在許多不足,如教學方式比較單一,教學內容偏重理論講解等,為此,提出以下教學方法的改革:?
(1)通過多種途徑激發學生的學習興趣。課程的學習效果,直接受到學生興趣和參與意識的影響。一般來講,《人工智能》作為一門前沿課程,開始學生學習興趣很大,當開始接觸到抽象理論知識及部分算法時,學生往往感到不易接受。 我們通過各種途徑和方法, 激發和培養學生的學習興趣,包括鼓勵學生參與某部分知識的擴充性資料查找,預留一定時間請學生負責對此內容進行講解,布置學生對某個基本成型的實驗進行糾錯及驗證,降低問題解決的難度。學生因此產生興趣從而做更深度研究。?
(2)進行啟發式教學。 我們可以嘗試在教學過程中不斷提出問題請學生思考,啟發學生求解這些問題,鼓勵學生提出自己的猜想和解決方案,然后擺出教材中的解決方案,并與同學所提出的觀點進行分析和比較,這足以加強學生學習的主動意識和參與意識,提高學生學習的積極性。?
(3)課堂辯論與交互式教學。 組織課堂辯論,討論的議題可定位為譬如人工智能是否能超過人類智能等有爭議的問題。學生通過對這些問題展開激烈爭論,激發了學習潛能,明確了學習目標。當然師生間的交流方式還有很多,如郵件互發、QQ留言等,也可在課程網站中的互動平臺進行交流。?
(4)分層次因材施教。 在授課過程中,通過對每個具體學生的學習進度、課堂作業情況進行及時評估,對學生提出進一步的學習建議和指導, 實現個性化的教學。 對優秀學生探討,可以在教學設計和實驗設計中要求其選作部分探索性、創新性的功課和實驗,以發揮學生個性優勢。對于有意于將來從事中小學教育的學生可以在機器人及人工智能技術發展現狀等知識層面對其做問題講解。而那些看似缺乏興趣的學生,我們可以用多媒體手段如播放人工智能相關電影及科學小片引起其興趣,實行逐步引導的教學過程。?
另外,我們可以嘗試雙語教學。 采用中文教材和講授的同時,注重在課程中的關鍵詞同時用英文表示,并適當指定英文參考短文和英文參考書。使學生能夠接觸國外文獻資料,加深對學習內容的理解,獲得更寬廣的知識。我們也可以在教學內容安排上,注重理論聯系實際,將一些人工智能網絡上的虛擬實驗給學生進行課外上網練習,從而使學生了解算法的具體運行過程, 通過參與達到知識的理解,掌握基本方法和技術。?
根據現有的條件,我們在教學中可以采用多媒體教學和網絡課程教學相結合的方法,充分利用多媒體的豐富表現形式,利用網絡課程的交互性、情景化等特點,構筑以學生為主體的《人工智能》課程現代教學模式。 對于抽象知識,可通過動畫和視頻演示,通過聲音和圖像展示人工智能的歷史、人物和前景,做到學生直接而深刻地看到知識的內涵外延。網絡課程能較好地實現交互并使學習過程情景化,通過網絡課程的課堂練習和章節練習,教師可以評價學生的學習情況,并給學生提出學習建議,從而提高學生的研究力和創新力。我們也可以給學生播放中學《人工智能》課程課堂教學錄像,以使學生看到初高中學生的知識范圍及深度;同時給學生播放現有的《人工智能》科學成果,讓學生看到理論背后的實踐;也可以播放科幻片,激發學生想象的翅膀從而有興趣把人工智能作為將來深造的方向?!度斯ぶ悄堋肥且婚T較新的課程,改進教學方法和手段不僅要靠教師,也應增加硬件設備的投入。如果人工智能能采用智能輔助教學系統或機器人輔助教學過程逼真、形象,一目了然,這樣可大大提高學生的學習效率,尤其是提高學生的觀察判斷能力、發現問題和解決問題的能力。?
4 人工智能實踐教學設計的探討?
我們可以在教學過程中,適量開設一些實驗和設計,提高學生的動手能力,并加深他們對理論知識的理解,降低理論的抽象度,提升理論的實用性。在近兩年的教學過程中,我們會適量加入一些人工智能語言的教學過程。例如,在講解了“野人與傳教士過河”等問題后,我們可以讓學生使用Visual Prolog或者C ?++?對算法進行實現;在講解 TSP 問題的遺傳算法解決案例后,指出編碼方案、初始種群大小、進化代數、交叉率變異率等因素對求解結果的影響,并要求學生通過實驗的方式來分析、理解這些問題,并提出“尋找更有利的解決方案”等問題。把學生的興趣激發后,為解決這些問題,學生會在課外主動查閱相關文獻、相互討論以實現他們所設計的方案,這樣既培養了學生善于鉆研和勇于創新的精神又提高了學生的實踐與創新能力。?
參考文獻:?
[1] 熊德蘭,李梅蓮,鄢靖豐.人工智能中實踐教學的探討[J].宿州學院學報,2008(1).?
[2] 何元烈,汪玲.“Visual C ?++?”在“人工智能”教學中的應用與探討[J].廣東工業大學學報:社會科學版,2008(8).?
摘要:在國家教育信息化發展持續推進的背景下,根據社會及地方發展的需求,重新定位現代教育技術專業的培養目標及優化課程設置是非常有必要的。本文通過探討邊疆地方高?,F代教育技術專業培養目標的重新定位及課程設置的調整與優化,以期能夠為培養出推進邊疆地方教育信息化人才提供一些思路。
關鍵詞:邊疆地方高校;現代教育技術專業;培養目標;課程設置優化
一、邊疆地方高校現代教育技術專業培養目標的重新定位
做好學科專業建設,首先就是明確培養目標,也就是要培養什么樣的人。邊疆地方高校的現代教育技術多設為??茖I,主要培養的是邊疆地方所需的現代教育技術應用型人才。不論是本科還是??疲逃夹g學科的人才培養目標一直以來都存在一個比較突出的問題,就是比較“全”,也就是要求所培養的人才是一個“全能人才”,既懂教學又懂技術,既懂科研又懂管理。這樣定位出來的培養目標,必然導致后面課程的設置也是非常全面,學生在學習的時候就感覺什么都學,但又什么都學不好。針對這種情況,結合邊疆地區教育信息化發展的現狀,在進行人才培養方案修訂時重新對專業培養目標進行了定位。本專業培養主動適應社會主義經濟文化建設和九年義務教育需要的,具備良好的人文、科學及專業素養,具有敬業精神、創新意識、實踐能力和可持續發展潛力的,能夠為地方區域性經濟和社會事業發展服務的從事小學(或初中)信息技術課程教學、校園教育資源開發與應用、教育影視與多媒體作品制作等工作的應用型人才。南國農先生曾對教育技術學專業的培養目標進行了闡述,他認為“教育技術學專業要培養的,是本學科領域既懂教育又懂技術的創造型人才,主要是四種人:教學人員———中等學校信息技術課教師;技術人員———教育軟、硬件開發人員;科研人員———新理論、新技術、新產品研究、設計人員;管理人員———電教機構、網絡教育系統等管理人員?!盵1]專業的培養目標不可能完全涵蓋這四種人才,邊疆地方高校應根據地方發展的實際需求來設定培養目標。對于邊疆地區來說,中小學信息技術教育相對落后,極需能夠從事中小學信息技術教育的教師,因此將培養目標主要放在能夠從事小學(或初中)信息技術課程教學的人才培養上,也就是南國農先生提及的“教學人員”。對于??茖哟蔚膶W生,這種培養目標的定位應該是恰當的。正如王竹立教授在《衰落,還是興盛?———關于教育技術學科前景的爭鳴與反思》一文中指出:我國目前教育技術人才培養分為專科生、本科生、碩士研究生和博士研究生等不同層次。應根據市場的需求,來確定不同層次的人才培養目標。例如,“一般的中小學需要既能講授信息技術課程,又能從事計算機和網絡設備與平臺維護的技能型人才;在線教育企業和各級教育信息化部門需要懂得教育技術和教育信息化基本理論,具有一定的設計、開發與管理能力的人才;高等院校和學術單位需要具有較深厚教育技術理論素養、對教育教學問題有深刻認識和洞察力的研究型人才?!盵2]邊疆地區整體教育信息化發展較為滯后,以培養學生信息素養為目標的課程主要由中小學信息技術課程來承擔。因此,對于邊疆地方高校來說,培養能夠承擔邊疆地方中小學信息技術教學的教師應是現代教育技術專業最重要的培養目標。在這個培養目標中,還涉及到了校園教育資源的開發與應用、教育影視與多媒體作品制作等,這與前述并不矛盾,因為教育信息化時代要求所有學科的“教學人員”都要具備這些能力。
二、邊疆地方高?,F代教育技術專業課程設置的調整與優化
明確專業培養目標后,就要建立相應的專業課程體系,也就是要讓學生學什么。對于邊疆地方高校的現代教育技術專業來說,其培養的學生可以說是邊疆地區教育信息化的主力軍,他們既要懂教學又要懂技術。因此,在課程設置中,主要包含四個方面的課程內容:一是專業教育類課程,二是技術類課程,三是通識類課程,四是實踐類課程。人才培養目標重新明確后,對課程設置尤其是技術類課程進行了較大的調整與優化。在重新調整后的課程設置中,教育類課程增加了《新技術新理念在教育教學中的應用研究專題學習》,該門課程主要是針對新技術新理念在教育教學中的應用研究進行分專題學習,例如人工智能技術、虛擬現實技術、SMART理念等在教育教學領域中的應用研究,旨在通過專題學習的方式,讓學生了解前沿技術在教育教學領域中的應用。技術類課程調整比較大,主要體現在以下四點:第一是在原有課程的基礎上結合發展的需要進行名稱和內容的改變,如將《Flash多媒體課件設計與制作》課程調整為《二維動畫創意設計》。從目前課件制作和使用方面的實際情況來看,大多數教師還是采用PowerPoint軟件來制作,甚少有使用Flash軟件來制作教學課件的。從以往的教學情況來看,使用Flash軟件制作課件一是費時二是學生最終學下來的效果并不理想,制作出來的Flash課件的質量甚至還不如用Power-Point制作的課件。但Flash這個軟件在制作教學資源方面也有其長處,比如制作一些具有教育意義的動畫短片或一些需要具體形象化的教學內容演示動畫,基于這樣的一些考慮,故將這門課程進行了名稱的更換,同時課程內容也有所相應變化,更多注重的是學生在教學資源上的創意設計。另外,考慮到課件制作是現代教育技術專業學生必須掌握的技能,故將這部分的內容開設在《信息化教學資源設計與制作》這門課程中,這門課程主要涉及PowerPoint課件、微課等的設計與制作,盡可能使教學內容符合當前教學資源的設計制作需要。《現代教育技術綜合實訓》調整為《現代教育技術學科實踐項目專題》,前者主要是以指導學生畢業設計為主進行教學,后者將結合中小學校信息化教育的變化來設置實踐專題,如創客教育等。第二是新增了一些課程。如《Python程序設計語言》,開設這門課程主要是考慮到邊疆地區中小學校今后信息技術課程內容的變化(當前有些發達地區的中小學校已經開設了Python這門課程),現代教育技術專業學生盡早掌握這門語言的學習對于他們今后的職業生涯會有一定的幫助。第三是調整部分課程的課程類型,并重新梳理內容。如《網絡教育應用》這門課程之前是選修課,且以理論為主,調整后將其保留并設為必修課程,且以實踐操作為主,如校園網的設計、開發與維護,慕課平臺的搭建等。第四是刪減技術類的選修課程,原課程設置中有多門選修課程且有些課程之間是有重復的,如《電視節目編導與制作》、《教育電視節目制作》這兩門課程對于現代教育技術專業來說,最主要是掌握教育電視節目的制作(主要以與教育教學有關的微電影的制作為主),且在必修課程中已有《攝影攝像技術及后期編輯》作為前期課程作支撐,所以不需再設置《電視節目編導與制作》,同時將《教育電視節目制作》改為《教育類微電影制作》。原課程體系中技術類選修課程太多,且課程與課程之間的聯系不是很緊密,導致學生學得雜而又學得不精,故最終只保留了四門技術類的選修課程。通識類與實踐類的課程根據學校的要求基本沒有做調整,只是根據相關規定,在實踐類課程增加了第二課堂教學實踐(主要包括綜合素養模塊、社會實踐模塊、創新創業模塊等)。
三、結語
現代教育技術專業既與教育有關,又與技術有關,所以在課程體系設置方面,兩者都要兼顧到,但如果專業定位不明確,特色不突出,就容易導致理論與實踐脫節、學生學得雜而又學得不精的局面。就如學生感嘆:專業課程學得挺多,但論教育理論功底比不上小學教育專業的,論計算機方面的操作與系統設計開發能力不如計算機專業的,“成為兩個專業都沾邊的局外人”。為了解決上述的問題,在明確人才培養目標的基礎上,對原有課程設置進行了調整與優化,其中技術類課程的調整幅度最大,增加了一些具有實用且具有一定特色的技術類課程,如與教育動畫短片設計有關的《二維動畫創意設計》、與教育類微電影制作有關的《教育類微電影制作》、與微課等設計有關的《信息化教學資源設計與制作》。焦建利教授曾說過:“很多情況下,我們過于關注技術,忽略了教育本身。我們必須思考為什么需要技術以及如何應用技術解決教學中的問題?!盵3]因此,這些實用且具有特色的技術類課程的設置,主要是要培養學生具有教育意識的技術思維,具備將技術服務于教育教學的能力。當然,在設置這些技術類課程時,也要防止一味地追趕新技術,要清楚使用技術的最終目的是為教育服務,應具有對技術的批判性思維。另外,教育技術學本科專業開設的一些課程也不能盲目搬到現代教育技術??茖I上來,如《信息技術與學科課程整合》,因為邊疆地區現代教育技術??茖W生最主要具備的是能勝任中小學信息技術課程教學的能力。
【關鍵詞】中文信息處理;自然語言理解;語用統計;模板匹配
中華文化的博大精深給中文應用者提供了縱橫馳騁的廣闊空間,由于個人的受教育程度、職業需要及文字風格的千差萬別,多數人都需要一個完全按照個人意愿編制出來的詞庫,即具有個性特征的個人專用詞庫,從這以意義上說,從Windows95開始為用戶提供的“輸入法生成器”。實在是功德無量。
Windows98問世以后,由于硬盤與內存容量的不斷升級,以及CPU反映能力的加速,使得在Windows平臺下的自定義輸入法有了更加廣泛的應用空間,而且突破了6.5萬詞條的限制。從理論上說,自定義的輸入法可以做得無窮大。目前我個人使用的《沈沉詞庫》的詞條就已達6萬條。WindowsMe與Windows98是姐妹版,同樣可用自定義的方法來生成自己個性化的輸入法。但WindowsXP卻把原先的“輸入法生成器”取消了,即使把Windows98下的“輸入法生成器”拷貝到WindowsXP,雖能轉換碼表,但卻不能安裝。不論微軟對WindowsXP如何地自吹自擂,但取消“輸入法生成器”,無論如何是失算的。
一、基于計算機漢字輸入的研究
應用需要一些軟件的支持,才能科學,優化,好用.目前不少發明人已擁有一些專用軟件,為有效利用這些軟件資源,節省人力時間,降低研究成本和周期.建議:這些軟件集中起來,統一管理。讓需用者登記申購,一次發放。這樣供,需,管均受益,并助學術繁榮,軟件舉例:
1.靜態重碼率自動收索統計軟件searcherro
2.漢字詞匯自動排序刪除重復軟件
3.各種輸入法教學軟件等
4.計算機降低重碼軟件
5.計算機操作記憶增速軟件.
6.漢語各種專業詞匯庫(20多專業)軟件
7.漢語綜合詞匯庫軟件
8.直接掛接進入windows9x編碼生成器的軟件
二、基于智能規范碼輸入平臺的實現
智能規范碼輸入平臺是有八個編碼方案的復雜系統。由智能規范拼音、智能規范雙拼、智能規范形碼、智能規范數碼和普通規范合碼所組成。其中普通規范合碼包括規范拼音、規范雙拼、規范形碼、規范數碼。智能、普通規范數碼在數字鍵區輸入漢字。平臺初始狀態為智能態。智能規范拼音最大輸入6碼,智能規范雙拼與智能規范形碼為2碼,智能規范數碼為3碼。用快捷鍵相互轉換。智能狀態由轉換符轉至普通狀態時,首字符為數字時碼長最長為6碼,輸入普通規范數碼,首字符為字母時碼長最長為4碼。不足碼長時用空格返回智能狀態。
智能規范碼的用戶范圍是普通人群,特別是中小學生。所以學生版在GBK字符集中異體字與不規范字不參加編碼。由于GBK的字符集里包含了中日韓三國所使用的漢字,所以日本和韓國用的漢字也不參加編碼。普通版為GBK字符集,超集版為GB18030字符集。
智能規范碼輸入平臺采取雙智能輸入的混合輸入方式,可以減少輸入量即減少碼長,減少鍵選率。加快了輸入速度。
漢字不再需要人工編碼,智能非智能輸入方法已有長時的研究和應用,關于智能混合輸入,作者進行嘗試,特點很多,尤其對詞的岐義處理具有一定的特色??梢哉f是具有獨特風格的智能漢字輸入平臺生成系統。
三、基于語用統計的智能輸入軟件
1.原理
主要利用語用統計的數據來消化同音字、詞,以及化解歧義分詞。在學科分類中屬于運籌學范疇。
使用概率統計運籌決策的方案很多,文獻[5]通過統計字字相關的同現概率矩陣來完成漢語語用統計庫結構.這個矩陣的大小是固定不變的.只與字符集的大小有關。文獻[5]作者通過搜索了500萬字語料給出了一個3673 X 3673的同現概率矩陣。文獻[4]是基于幾理解和基于語用統計相結合的設計。該設計根據分詞后的輸入語句查找知識庫.用句法、詞法、語義和自定義的規則作為制約對文章進行解析推理,當存在同音詞時。采用最優評價法來確定最佳選擇作為轉換結果。同音詞的評價值需要考慮詞性、同現概率、近期使用狀況等因素。具有最優評價值的選擇即為轉換結果。當具有最優評價值的第一選擇而非日標選擇時,可選用次優選擇或用手工方式進行修正,候補修正或人工修正均被記錄,作為下次轉換時修改計算評價值因素的依據,也就是自學習功能。
2.典型作品
蔡榕先生設計的最優評價函數法拼音漢字轉換系統;
蔣先生設計的Autoway;
清華大學人工智能實驗室夏瑩等研制的智能輸入軟件。
3.優點與存在的問題
優點:(1)對于己經進行過語用統計或者具有相同類型的領域,系統的轉換正確率比較高,或者說語用統計具有偏向性。對每一個用戶而言,在使用過程中,語用統計庫將會從最初的通用型逐漸改變為符合這個用戶語用習慣的專用型。(2)軟件開銷較小,在CPU為486的機器上就能運行。
存在的問題:(1)作為一個整體的同現概率矩陣,不能做到模塊化、積木化。(2)偏重整句處理,當出現轉換錯誤時,需要使用者回頭去糾正,干擾了正常的思維。(3)當前,自動分詞的準確度只能達到98%左右,鍵選率的降低受到限制。
四、基于模板匹配的智能輸入軟件
1.原理
寓漢語語法知識于巨量的短語串中,進而利用這些短語串來消化同音字、詞.以及化解歧義分詞。這種短語串通常稱之為“模板詞”。
這種系統通過模板詞搜索引擎來完成漢語語法體系的組織。需要搜索巨量的語料.獲取巨量的短語串,才有可能大體上包容漢語語法知識。例如:智能狂拼搜索了100億字語料,模板詞庫最大時需要約540MB存儲空間。根據分詞后的輸入語句查找模板詞庫和句法規則庫,然后進行匹配處理。如果匹配結果唯一,則不必再用概率推理;若存在兩個以上的候選結果時,則根據句法規則或概率推斷進一步判定,選出一個最有希望的可能結果作為輸出。
2.典型作品
中文之星數碼科技有限公司推出的智能狂拼;
黑馬新技術公司推出的黑馬智能輸入軟件;
大自然軟件開發有限責任公司推出的自然碼2000(句輸入版)。
3.優點與存在的問題
優點:對于幾己經搜索過模板詞的或者具有相同類型的領域,系統的轉換正確率比較高,或者說模板詞庫具有偏向性。對每一個用戶而言,在使用過程中,模板詞庫將會從最初的通用型逐漸改變為符合這個用戶語用習慣的專用型。
存在的問題:(1)模板詞數量巨大,對電腦硬件有一定的要求。486及以卜的低檔機難以使用。(2)對拼音輸入的模板匹配智能輸入軟件而言,通常只支持漢語拼音的26鍵位輸入,注重連續和完整的音節輸入,平均碼長較長,采用簡化拼音輸入時鍵選率較高。(3)偏重整句處理。當出現匹配錯誤時,需要使用者回頭去糾正,干擾了正常的思維。自動分詞的準確度只能達到98%使鍵選率的降低受到限制。
五、基于上下文關聯的智能輸入軟件
1.原理
文獻[5]采用語用統計來實現上下字關聯智能輸入。下面介紹的是一種基于模糊控制理.利用上下文關聯(向上關聯4個詞語,向下關聯1個詞語)的語用環境來智能選擇重碼字。在學科分類中屬自動控制分支非線性控制范疇。將自然語言看成是一個模糊的集合,將漢字輸入系統作為一個非線性控制范疇的模糊控制系統來對待,預學習工具(或者轉換出現錯誤時的手工鍵選信號),相當于一個傳感器,算法程序、漢語知識庫和動態語用統計庫作為非線性調節器,使得系統的鍵選率和平均碼長逐漸趨于最優。例如,青月亮漢字通上文關聯4個詞,下文關聯1個詞,合計上下文關聯5個詞,這一調節機制涉及到許多相互矛盾和相互牽制的受控參數,模糊集合的特征函數從[0,1]區間連續取值,可以較為準確地表現各種語言現象差異,獲得比較好的效果。
2.典型作品
青月亮科技開發有限公司推出的青月亮漢字通智能輸入軟件平臺GM 3.1
一筆軟件有限公司推出的一筆智能輸入軟件(26鍵位和10鍵位)
字原科技有限公司推出的101智能輸入軟件TZ8.2/9.1/20000
3.優點與存在的問題
優點:(1)對學習過或者具有相同類型的語料,鍵選率比較低,或者說漢語知識庫具有偏向性。對每一個用戶而言,在使用過程中,漢語知識庫將會從最初的通用型逐漸改變為符合這個用戶語用習慣的專用型。(2)青月亮漢字通作為一種音碼、形碼和筆畫碼二位一體的通用智能處理平臺,支持26鍵位、10鍵位、8鍵位和5鍵位規模的鍵兀集,支持GB18030的27533超大字符集,為各種輸入法增加上卜文關聯智能輸入的后處理支持.讓這些輸入法變得更易學、更好用。(3)采用字段輸入,不使用語句級輸入,使語法規則簡約化,易于知識表達。此舉不但降低了鍵選率,還大大緩解了輸入過程中“回頭看”的問題.基木上貼近了人們的使用習慣。(4)程序開銷積木化,在CPU為486的機器上就能運行。遵從一系列信急處理用的國家標準和規范,特別是與漢字輸入密切相關的兩個標準《GB/T 18031-2000信急技術數字鍵盤漢字輸入通用要求》和《GB(待定)信息技術通用鍵盤漢字輸入通用要求》。(5)旅拼音輸入時,采用人工分詞。在形式上與英文接軌,既可以避免3%的歧義分詞錯誤,也可以兼容簡拼輸入,大幅度降低鍵選率和平均碼長。青月亮漢字通在保證支持完整拼音輸入的同時,尤其提倡使用簡拼輸入(一個音節要么只取音節的首字母,要么就取完整音節)。
存在的問題:(1)字段輸入還未能完全根治輸入過程中“回頭看”的問題,每當終選字詞有錯時,仍然需要近距離的即時修改。(2)對“上下文關聯”機制的人機界,而用戶需要一個熟悉的過程。因此,青月亮漢字通也允許使用者關閉“上下文關聯”智能輸入,僅保留“上文關聯”機制和恢復逐字、逐詞上屏的輸入方式。
六、結束語
上世紀八十年代我國學者提出的“從開發人腦到開發電腦”、“字為基礎、詞為主導、智能處理”,只是指明了漢字輸入技術的發展方向。時至今日,己有近十種輸入法采用了智能化處理重碼的技術。這些智能輸入軟件中有的采用人工智能理論,有的依據概率統計方法,有的依靠自動控制技術,多數軟件設計兩種方法。效果較好的青月亮軟件更是在模糊控制的框架內使用了語法規則和動態語用統計。(下轉第9頁)(上接第4頁)如果像當年“萬馬奔騰”一樣,智能化軟件也形成“百花齊放、百家爭鳴”的局而,則錢偉長教授要求的易學、易用的理想的輸入方法的實現為期己經不遠了。
參考文獻:
[1]俞士汶.中文輸入中語法分析技術的應用[J].中文信息學報,1988(3).
[2]王曉龍等.語句級漢字輸入技術[J].中文信息學報,1996(12).
[3]章森等.語句拼音漢字轉換的智能處理機制分析[J].中文信息學報,1998(2).
[4]蔡榕.最優拼音漢字一次輸入變換法及拼音漢字轉換系統的實現[C].第三屆中文信息處理國際會議論文集,1992,10.
[5]夏瑩等.利用上下文相關信急的漢字文本識別[J].中文信息學報,1996(2).
[6]郭進.統計語言模型及漢語音字轉換的一些新結果[J].中文信息學報,1993(1).
[7]仲興國.多詞組一次性拼音漢字變換[J].中文信息學報,1990(6).
[8]張普.智能化漢字鍵盤輸入法的最重要發展方向[M].中國標準出版社,1997(2).
[9]陳一凡.漢字編碼輸入技術的發展趨勢[J].計算機世界,1987,11(8).