Smurto kontrolės lietuviškame saityne sąryšis su semantinių ir kalbos technologijų plėtra
Mykolo Romerio universitetas |
Date Issued |
2011 |
Elektroninėje erdvėje sparčiai plinta nekontroliuojamas elektroninis smurtas. Elektroninės kontrolės objekto – informacijos – kiekis saityne irgi sparčiai didėja. Esami skaičiavimo metodai jau nesugeba jo apdoroti. Nors vis didėja informacijos dalis, perduodama vaizdu ir garsu, bet tekstas išlieka pagrindine informacijos perdavimo forma. Didelius kiekius tekstinės informacijos ar kitokių nestruktūrizuotų duomenų analizuojančios teisėsaugos bei viešojo saugumo užtikrinimo institucijos susiduria su problema, vykdydamos informacijos lietuvių kalba paiešką ir analizę – nėra veiksmingų prasminės (semantinės) teksto paieškos ir analizės priemonių, pritaikytų dirbti su lietuvių kalbos tekstais ir duomenimis. Reikalingos kokybiškai naujos, semantinės ir kalbų technologijos, kurios mokėtų analizuoti ir apibendrinti informaciją pagal jos prasmę. Atlikus tyrimą nustatyta, kad Lietuvos mokslininkai jau pajėgūs sukurti ir įdiegti semantinių ir kalbos technologijų naujoves, būtinas teisėsaugos bei viešąjį saugumą užtikrinančioms institucijoms. Tačiau tai padaryti kliudo vėluojančios valstybės strateginės programos ir priemonės, bendros kalbos technologijų išteklių ir įrankių vystymo koncepcijos nebuvimas, nepakankamos valstybės investicijos į semantinio pasaulinio tinklo technologijas, ribotas bendradarbiavimas tarp privataus ir viešojo sektoriaus, bei akademinės bendruomenės.
The current Lithuanian language and semantic resources are inadequate, the basic technologies are not sufficiently developed, therefore, , the technological solutions and services of the semantic analysis of Lithuanian written language does not meet the demand, underused national and international integration opportunities, there is a threat to the preservation of the written Lithuanian language on the Internet. This situation is due to the lack of cooperation between the private and public sector, and academic researchers, which is very effective in other European Union countries. The law enforcement and public security authorities, which must proceed with analysis of large amounts of textual information or other unstructured data, are faced with the problem of efective search and analysis of information in Lithuanian language - there is no effective semantic search and text analysis tools tailored to work with Lithuanian language text and data. Developed and implemented semantic language technologies and innovations can to ensure to law enforcement and public security authorities the quality of the implementation of public security in cyberspace who would have a positive impact on the entire state. However, it is hindered by delays in state strategic framework and tools, by the absence of the concept of language technologies and tools development, by the lack of public investment in a global network of semantic technologies, by the limited cooperation between the private and public sector, and researchers.