Skip to main content

Curs d'aprenentatge automàtic pel processament del llenguatge natural

  • Ponents:
    • Aleix Ruiz de Villa, consultor de Data Science
  • Organitzat per: Institut d'Estadística de Catalunya
  • Lloc: Sala de microinformàtica. Idescat
  • Dates: 26 de juny, 3 i 10 de juliol de 2024
  • Règim: restringit
  • Places: 15
  • Hores lectives: 8 h
  • Codi de l'activitat: R482/2024

Destinataris

Personal estadístic del Sistema estadístic de Catalunya, preferentment els que puguin treballar en l'elaboració d'estadístiques que requereixen l'ús de l'aprenentatge automàtic.

Horari

  • 26.06.2024

    12.00 h – 15.00 h

  • 03.07.2024

    11.00 h – 13.30 h

  • 10.07.2024

    12.00 h – 14.30 h

Descarregar

Programa

  • 1. Neteja de textos
  • 1.1. Neteja de textos (SpaCy)
  • 1.2. Extracció d'entitats (SpaCy) i resolució d'entitats
  • 2. Xarxes neuronals i PNL
  • 2.1. Formatació de textos amb tokenizers
  • 2.2. Fonaments de l'aprenentatge automàtic amb keras
  • ■ Regressió lineal i logística amb keras
  • ■ Minimització d'errors amb l'algorisme de gradient estocàstic
  • ■ Validació creuada

Resum

Curs per explicar els mètodes del processament del llenguatge natural (PLN) amb l'objectiu que els assistents els puguin integrar a la feina.

Es treballaran les eines clàssiques de neteja de textos amb SpaCy.

En un altre curs es tractaran les tècniques modernes, basades en el model de llenguatge extens (MLE).

Observacions

Metodologia basada en la combinació de part teòrica i part pràctica (exercicis).

Inscripció

La inscripció a aquesta activitat ja no està oberta.