Curs d'aprenentatge automàtic pel processament del llenguatge natural
- Ponents:
- Aleix Ruiz de Villa, consultor de Data Science
- Organitzat per: Institut d'Estadística de Catalunya
- Lloc: Sala de microinformàtica. Idescat
- Dates: 26 de juny, 3 i 10 de juliol de 2024
- Règim: restringit
- Places: 15
- Hores lectives: 8 h
- Codi de l'activitat: R482/2024
Destinataris
Personal estadístic del Sistema estadístic de Catalunya, preferentment els que puguin treballar en l'elaboració d'estadístiques que requereixen l'ús de l'aprenentatge automàtic.
Programa
- 1. Neteja de textos
- 1.1. Neteja de textos (SpaCy)
- 1.2. Extracció d'entitats (SpaCy) i resolució d'entitats
- 2. Xarxes neuronals i PNL
- 2.1. Formatació de textos amb tokenizers
- 2.2. Fonaments de l'aprenentatge automàtic amb keras
- ■ Regressió lineal i logística amb keras
- ■ Minimització d'errors amb l'algorisme de gradient estocàstic
- ■ Validació creuada
Resum
Curs per explicar els mètodes del processament del llenguatge natural (PLN) amb l'objectiu que els assistents els puguin integrar a la feina.
Es treballaran les eines clàssiques de neteja de textos amb SpaCy.
En un altre curs es tractaran les tècniques modernes, basades en el model de llenguatge extens (MLE).
Observacions
Metodologia basada en la combinació de part teòrica i part pràctica (exercicis).
Inscripció
La inscripció a aquesta activitat ja no està oberta.