Bune practici privind formarea profesională a cadrelor didactice pentru educație incluzivă de calitate pentru proiectul ProFORM

 

 

 

Codul proiectului: POCU/73/6/6/108182

 

Titlul proiectului: „ProForm - PROfesionalizarea cadrelor didactice prin FORMare continuă”

 

2 alb2 alb1 negru     Beneficiar  /        Partener 1/        Partener 2: Asociaţia Societatea Naţională Spiru Haret pentru Educaţie, Ştiinţă şi Cultură

 

Numele și prenumele expertului: Albeanu Grigore

 

Poziția în cadrul proiectului: Expert programe formare profesională

 

Nr. și tipul contractului 229/01.05.2018/ CIM

 

Categorie expert: Expert termen lung

 

 

 

Metode utilizate în sinteza textului

 

 

 

Larga disponibilitate a documentelor a impus extinderea cercetărilor  în domeniul rezumării  textelor pentru automatizarea procesului. Un rezumat este definit ca un text produs dintr-unul sau mai multe texte, care transmite informații importante în textul (textele) inițial și care nu are mai mult de jumătate din lungimea  materialului inițial și, de obicei, semnificativ mai scurt decât acesta [1].

 

Este important de considerat şi domeniul la care se referă textul. Metode de rezumare a textelor medicale sunt descrise in [3]. Principalii factori care influenţează rezultatul rezumării sunt [3]:  document unic versus multi-document, numărul de limbi în care documentele de intraresunt scrise, text versus rezumate multimedia, rezumate informative versus rezumate indicative, rezumări generice versus rezumări utilizator (relevant pentru o interogare a unui utilizator), scop general versus specific domeniului, calitatea rezultatului, extractiv (reducţie) versus abstractiv .

 

 

 

 

În continuare, pornind de la [4], prezentăm câteva idei privind metodele de sinteză a textului prin rezumare.

 

Rezumatul extractiv se obţine folosind o metodă de a găsi algoritmic cele mai informative propoziții dintr-un corp mare de text, care sunt utilizate pentru a forma un rezumat. O metodă extractivă simplă are la bază ordonarea propozițiilor pe baza frecvența cuvintelor [2]: frecvenţa cuvîntului este ponderea sa (numărul de apariţii divizat cu lungimea propoziţiei).  Cu aceste ponderi determinăm un scor al propoziţiei. Ordonăm propoziţiile în funcţie de scor şi le selectăm pe cele cu scorul mai mare de un prag (de exemplu scorul mediu). Metoda poate fi îmbunătăţită dacă considerăm sinonimele. Totuşi, rezultatul nu este potrivit pentru sarcinile de rezumare folosite în mod obişnuit în şcoală și nici nu îndeplinește cerinţele unor teme școlare.

 

Rezumatul abstractiv se obţine folosind o metodă de a genera algoritmic fraze concise care sunt în mod semantic coerent cu corpul mare de text. Aceasta este mult mai în linie cu modul în care oamenii rezumă textul, dar este, de asemenea, mult mai dificil de automatizat.

 

Rezumatul informativ transmite cu acurateţe informațiile conținute într-un text sau în alt tip de resursă. Un rezumat informativ trebuie să fie cât mai obiectiv, adică sa evite cu stricteţe includerea în rezumat a unor opinii personale ale celui care face rezumatul. Acest tip de rezumat este recomandat pentru lucrări științifice, non-ficțiune, sau atunci când este necesar să se prezinte rapoarte obiective asupra unor conținuturi factuale [4]. Principalele tipuri de rezumate informative sunt: schița, abstractul și sinopticul. Schița arată ordinea și relația dintre părțile materialului scris. Abstractul prezintă ideea principală a unui text lung, sau a unui articol. Abstractul este destinat sa ajute cititorii să decidă dacă doresc sau nu să citească întregul text. Sinopticul este o descriere concisă, cronologică a unui eveniment istoric, eveniment de știri, sau a altor fenomene din perspectiva derulării lor în timp [4].

 

Rezumatele descriptive se referă la textul (materialul) original, mai degrabă decât la conţinutul acestuia. Un rezumat descriptiv prezintă într-un mod obiectiv, structura textului sursă și temele principale.

 

În ceea ce priveşte rezumarea automată, o soluţie ar fi utilizarea unor modele de rezumare cu care se antrenează o reţea neuronală multistrat [5], o tematică pentru cluburile de excelenţă . 

 

 

 

Concluzii

 

 

 

Sinteza textului este necesară nu numai elevilor, dar şi cadrelor didactice, cercetătorilor şi oamenilor care trebuie să parcurgă cantităţi uriaşe de documente într-un timp scurt.  Materialul realizează o introducere în rezumarea textului cu întenţia de a lansa o provocare cadrelor didactice cuprinse în programul ProForm care predau matematică, informatică, respectiv TIC.

 

 

 

Bibliografie

 

 

 

1.       Mehdi Allahyari, Seyedamin Pouriyeh, Mehdi Assefi, Saeid Safaei, Elizabeth D. Trippe, Juan B. Gutierrez & Krys Kochut. 2017. Text Summarization Techniques: A Brief Survey. In Proceedings of arXiv, USA, July 2017 (https://arxiv.org/pdf/1707.02268.pdf)

 

2.       ***, https://towardsdatascience.com/comparing-text-summarization-techniques-d1e2e465584e

 

3.       Rezumarea textelor medicale, http://cgi.di.uoa.gr/~takis/aim.pdf

 

4.       Sinteza textului, http://rom.explainwell.org/index.php/table-of-contents-synthesize-text/

 

5.       Gaetano Rosiello, Neural Abstractive Text Summarization, http://ceur-ws.org/Vol-1769/paper12.pdf