CO-RO-LA
Institutul de Informatică Teoretică al Academiei Române din Iași, în parteneriat cu Facultatea de Informatică din cadrul Universităţii „Alexandru Ioan Cuza” din Iaşi, au finalizat proiectul prioritar al Academiei Române CoRoLa (Corpusul computațional de referință pentru limba română contemporană): o colecție de texte (scrise și orale) de dimensiuni foarte mari (sute de milioane de cuvinte şi sute de ore de înregistrări vocale), completate cu metadate (autor, editură, data publicării, gen literar etc.) și adnotate cu informații de natură lingvistică și gramaticală (părți de vorbire, leme ale cuvintelor flexionate, analize sintactice etc.).
Prin naturaleţea textelor și prin adnotările pe care le va include, corpusul va fi util lingviștilor (pentru studierea diverselor aspecte ale limbii române), lexicografilor (pentru crearea de dicţionare generale sau speciale), celor care învață limba română ca limbă străină (ca sursă de exemple concrete de utilizare a cuvintelor și expresiilor în context, ori de relaţii pe care acestea le stabilesc cu alte cuvinte etc.), profesorilor care predau limba română în şcoala românească şi în străinătate (ca instrument de predare-învățare şi de evaluare a elevilor ori studenților).
În cadrul unui eveniment ce se va desfășura la Amfiteatrul „Ion Heliade Rădulescu” al Bibliotecii Academiei Române, București, Calea Victoriei nr. 125, joi, 14 decembrie 2017, începând cu ora 10:00.
Academia Română – prin Institutul de Cercetări pentru
Inteligență Artificială „Mihai Drăgănescu” din București și Institutul de
Informatică Teoretică din Iași – anunță lansarea publică a “Corpusului de
referinţă pentru limba română contemporană (CoRoLa)”.
CoRoLa, rezultat al unui proiect prioritar al Academiei
Române derulat pe parcursul a 4 ani, include peste un miliard de cuvinte
selectate din publicații românești apărute după 1945 și peste 150 de ore de
înregistrări vocale. Acest corpus este un instrument modern pentru studiul
limbii române, în acord cu practicile curente la nivel internațional, precum și
pentru crearea și adaptarea materialelor didactice de predare a limbii române
pentru români și pentru străini, în egală măsură.
La acest eveniment participă reprezentanți ai Academiei
Române, Institutului de Lingvistică „Iorgu Iordan - Al. Rosetti”, Institutului
de Filologie Română „A. Philippide”, Universității din București, Universității
“Alexandru Ioan Cuza” din Iași, Universității Babeș-Bolyai Cluj-Napoca,
Institutului de Filologie al Academiei de Științe a Republicii Moldova și
Institutului Limbii Germane din Mannheim, creatorul celui mai mare corpus al
limbii germane. Informaticieni și lingviști vor prezenta procesul construirii
corpusului, structura și utilitatea lui ca referință funcțională a limbii
române contemporane literare. Proiectul corpusului este susținut și de Fundația
Alexander von Humboldt, al cărei Secretar General adjunct va fi prezent la
lansare.
Biroul
de presă al Academiei Române
Persoane
de contact:
Niciun comentariu:
Trimiteți un comentariu