- Las nuevas técnicas que se investigarán en el proyecto IKER-GAITU tienen como objetivo detectar de forma automática el nivel de competencia del euskera; hacer llegar la tecnología de las voces personalizadas a las personas con discapacidad; la transcripción de la voz espontánea o el euskera a la altura de los sistemas de diálogo más potentes.
- HiTZ zentroa ha creado la red CLARIAH-EUS, relacionada con las infraestructuras científicas europeas CLARIN y DARIAH. Está compuesta por 137 personas investigadoras y 11 grupos o instituciones de investigación que investigan el euskera para fomentar la investigación en Humanidades, Artes y Ciencias Sociales y compartir el uso de datos y herramientas digitales.
El Gobierno Vasco subvencionará con 1.680.000 euros HiTZ ZENTROA de la Universidad del País Vasco/Euskal Herriko Unibertsitatea (UPV/EHU) para la investigación de nuevas técnicas y el fortalecimiento de la red de tecnología lingüística para incrementar la presencia del euskera en el ámbito digital. Así lo han explicado el consejero de Cultura y Política Lingüística, Bingen Zupiria, y la rectora de la UPV/EHU, Eva Ferreira, tras la visita que han realizado hoy a HITZ ZENTROA ubicado en Donostia.
Las tecnologías actuales y futuras exigen enormes masas de datos textuales y orales por lengua. En cambio, los datos que pueden ofrecer el euskera y las lenguas más pequeñas no son suficientes para que estas tecnologías tengan hoy en día la calidad suficiente. Por ello, es "imprescindible" investigar en tecnología lingüística para que el euskera tenga presencia en tecnologías que sean cada vez más habituales y que le lleven a la par que otras lenguas.
Así, a través de la subvención del Gobierno Vasco a HiTZ ZENTROA se abordarán dos proyectos. Por un lado, IKER-GAITU investiga las tecnologías lingüísticas para la obtención de nuevas técnicas (1,5 millones de euros) y, por otro, completa y consolida la red CLARIAH-EUS (180.000 euros).
En cuanto a IKER-GAITU, estas nuevas técnicas que se pretenden trabajar tienen los siguientes objetivos:
- Un sistema que capte automáticamente el nivel de competencia del euskera, escrito y oral;
- Hacer llegar la tecnología de las voces personalizadas a las personas con discapacidad;
- Transcripción de la voz espontánea, que se actuará también cuando se mezclen el euskera y el castellano y haya varias personas hablantes;
- Que los sistemas de conversación textual más potentes (como el chatGPT actual o el GPT4) se igualen a otras lenguas en euskera.
Por otro lado, en cuanto al segundo proyecto, contarán con el apoyo de la red denominada CLARIAH-EUS. CLARIAH-EUS nace como una red compuesta por 137 personas investigadoras y 11 grupos o instituciones de investigación en euskera, una red de personas, datos, recursos y herramientas. Esto une a gente de diferentes disciplinas (Humanidades, Arte y Ciencias Sociales, entre otras), lo que supondrá crear más sinergias para compartir materiales, contenidos y conocimientos. Cuatro personas investigadoras coordinarán el proyecto y dotarán de contenido a la red, fomentarán la colaboración entre las personas usuaria y canalizarán las demandas de los investigadores. CLARIAH-EUS es una ventana a una gran red europea que forma parte de las infraestructuras científicas europeas CLARIN-ERIC y DARIAH-ERIC y que permitirá a las personas investigadoras acceder a todos los recursos y herramientas existentes en estas infraestructuras europeas, con los siguientes objetivos:
- Mantener un inventario actualizado de los recursos digitales y avanzados de investigación en euskera.
- Promoverá proyectos de la comunidad que estudie en Humanidades Digitales y Ciencias Sociales y constituirá una plaza importante para la difusión.
- Propiciará la participación en las infraestructuras europeas CLARIN y DARIAH, así como la utilización de las herramientas y recursos desarrollados en las mismas y la adaptación al euskera de las más utilizadas en nuestra comunidad.
El consejero de Cultura y Política Lingüística, Bingen Zupiria, ha explicado que "en el ámbito digital dominan las lenguas hegemónicas, sobre todo el inglés. Es necesario que el euskera también tenga su espacio y vaya reduciendo la distancia con estas lenguas. En esa digitalización, que cada vez tiene más presencia en nuestra actividad diaria, nuestra lengua también necesita su lugar, porque si no otros ocuparán ese espacio ". Para ello, ha considerado imprescindible trabajar la tecnología del lenguaje: "queremos ser un ejemplo, queremos hacer un trabajo de tracción en el ámbito de la tecnología lingüística. Queremos crear y poner a disposición de los interesados las herramientas y recursos necesarios para que el euskera desarrolle una tecnología lingüística de calidad. También queremos impulsar el desarrollo del sector fomentando la competitividad y el empleo de calidad. Todo esto está en el núcleo de nuestra demanda a HITZ ZENTROA de la UPV/EHU. "
La rectora de la Universidad del País Vasco, Eva Ferreira, ha afirmado que "el desarrollo científico e intelectual del euskera no puede entenderse sin la aportación fundamental de la Universidad del País Vasco. Y así lo reconoce el Gobierno Vasco. Vivimos una auténtica revolución tecnológica y, en definitiva, esa revolución es también intelectual y social. A la realidad material se suma la realidad virtual. Hoy ya no hay realidad humana que sobreviva si no tiene una correspondencia adecuada en el mundo digital. Y la conclusión es obvia: el euskera tiene que estar ahí. Y tiene que estar fuerte, además, con los medios adecuados. Los proyectos que llevaremos a cabo reforzarán esa presencia ".
Eneko Agirre, director del HiTZ Zentroa, destaca la necesidad de la investigación: "La tecnología actual trabaja muy bien en lenguas con muchos hablantes, pero en las de menos hablantes tiene menos calidad. Por ejemplo, un estudio realizado en nuestro centro ha demostrado que con la masa de texto existente en la actualidad no se pueden entrenar para el euskera los modelos lingüísticos más poderosos que son motores de los sistemas de diálogo, y con la voz ocurre otro tanto ". Según ha dicho, "ante esto, estamos investigando en nuevos métodos para construir el sistema de diálogo y los modelos que trabajan con la voz, y como complemento a ello recogiendo masas de datos textuales y orales. Como centro público de investigación, todos los modelos y algoritmos que construyamos se compartirán libremente con los centros tecnológicos y las empresas del entorno, para que los avances que se hayan dado lleguen cuanto antes a la sociedad ". Por último, ha insistido en la necesidad de trabajar conjuntamente: "Si la sociedad vasca quiere una tecnología lingüística propia y de calidad en euskera, hay que poner en marcha una recogida masiva de datos de textos y voces, en la que sea clave la ocultación de las instituciones públicas y privadas en beneficio del euskera".
Hoy han visitado la Facultad de Informática donde se ubica HITZ ZENTROA para conocer de cerca a los 70 investigadores del centro y ver los materiales que hay allí. En la visita ha estado presente la viceconsejera de Política Lingüística, Miren Dobaran. La subvención concedida por el Gobierno se materializará en el periodo 2023-2025 y, mientras tanto, se constituirá una comisión para revisar y evaluar el detalle y los resultados.