• Mòbils
  • Videojocs
  • Smart Cities
  • Proximitat
  • Podcast
Dissabte, 25 de juny de 2022
  • Iniciar sessió
No Result
View All Result
Twitter
El Tecnològic
El Tecnològic
  • Mòbils
  • Videojocs
  • Smart Cities
  • Proximitat
  • Podcast
No Result
View All Result
El Tecnològic

Els prerequisits per crear un assistent virtual

Què cal tenir en compte?

Gina Stolwijk per Gina Stolwijk
18 de juny de 2021
in Emprenedor, Intel·ligència Artificial
Reading Time: 4 min
Compartir a FacebookCompartir a TwitterCompartir a WhatsApp

Cada vegada es creen més dades obertes que podem usar per a crear bots de conversa, o assistents virtuals, com ara les del Mozilla CommonVoice. Si t’han inspirat a crear el teu propi assistent virtual, però no saps per on començar, t’ajudem! En aquest article trobaràs uns dels punts per tenir en compte, les preguntes que t’hauràs de fer, i et donem uns quants recursos que poden ser d’utilitat.

El teu propi assistent virtual o bot de conversa

Abans de començar, quines preguntes cal fer?

Assistent de veu, o de xat?

Abans de començar, cal tenir en compte que crear un assistent de veu acostuma a tenir més complexitat que un assistent de xat. A més, per poder triar les dades necessàries per a entrenar el model, cal saber el tipus d’assistent que es crearà.

Quin és el públic objectiu?

Com més genèric siguin els teus usuaris objectius, més dades necessites. Pensa sobretot en característiques que poden afectar el so de la veu, però també en característiques relacionades amb el vocabulari. Exemples són usuaris amb diferents dialectes o de diferents edats. A més, si el teu assistent té, per exemple, la tasca d’ajudar a enginyers informàtics amb dubtes tecnològics d’alta complexitat, s’ha d’entrenar el model amb l’argot necessari.

Quina complexitat tindrà l’assistent?

Un assistent virtual pot tenir una utilitat molt específica, com ara ajudar-te a triar el millor restaurant, o una més general, com ara dir-te quin temps farà demà, quina és la millor ruta per anar al poble del costat, i a més quin és el vol més barat cap a Barcelona. Com et podràs imaginar, crear un assistent virtual més limitat requereix menys temps que crear-ne un de general.

On s’ha d’integrar?

Els algoritmes que mencionem més endavant s’executen amb Python. Si vols usar algun d’aquests, hauràs de tenir-ho en compte a l’hora de decidir on integrar el teu assistent virtual. Si necessites una integració per exemple amb PHP o JavaScript caldrà adaptar-lo, crear un servidor amb Python que es comuniqui amb el teu servidor, o usar algun altre algoritme o aplicació.

Necessitaràs moltes dades

Què cal per poder crear un assistent virtual? Necessitem dades massives de veu (gravacions d’àudio), que per ser suficientment representatives, han d’incloure variants dialectals i edats diverses.

Explica projecte Aina a Twitter.

Per poder entrenar el model de forma exhaustiva, necessitaràs dades massives. Com mencionat anteriorment, tingues en compte el públic que usarà el teu assistent de veu. Necessitaràs dades que representin a tots els usuaris objectius.

Si tens pensat crear un assistent de xat, no es necessiten gravacions de veu, i pots usar per exemple les dades del “C4 Multilingual Dataset“. Dades de veu es poden trobar per exemple en el nou projecte “CommonVoice” de Mozilla, al que també pots contribuir registrant la teva veu o validant les veus dels altres. Ambdues opcions consten de dades en una gran varietat de llengües, entre d’altres el català. 

Crear dades CommonVoice
Col·labora en l’expansió de la base de dades de CommonVoice

Triar com gestionar de diàlegs

Per gestionar un diàleg, necessites rebre la consulta de l’usuari, transformar-la en un format que el teu algoritme sap processar, i crear una resposta adequada. Aquest és un procés complex, que no explicarem en detall en aquest article, però en general es pot fer de dues maneres (o una combinació): aprenent unes normes fixes, amb les quals el model aprèn que algun tipus d’input es relaciona amb un output específic, o amb un model probabilístic, que va aprenent estratègies de diàleg gràcies a converses d’exemple. El primer tipus és més fàcil i menys abstracte d’implementar que el segon, però el segon ajuda a crear converses més naturals.

Finalment, un algoritme de processament del llenguatge natural

Per poder començar a construir el teu propi assistent virtual, necessites triar un algoritme que t’ajudi a processar el llenguatge natural (PLN) de l’usuari. Dóna-li un cop d’ull a la web de Hugging Face, per trobar milers de models preentrenats per al PLN, amb funcionalitats variades com ara classificació, respondre preguntes, traduccions… Els diferents mòduls de python proporcionats per transformers integren les llibreries Jac, PyTorch i Tensorflow, i són independents l’un de l’altre, per tal de poder entrenar únicament els models necessaris. El model BERTa, part dels transformers, també està disponible en català.

Python HuggingFace per al PLNPython HuggingFace logo curs

Etiquetes: Assistent VirtualBERTaBot de conversaCommonVoiceHugging Face
Gina Stolwijk

Gina Stolwijk

Holandesa infiltrada a Catalunya, estudiant d'intel·ligència artificial.

Next Post
Mobile world congress virtual

Guanya una entrada digital per al Mobile World Congress 2021

Deixa un comentari Cancel·la les respostes

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *

Aquest lloc utilitza Akismet per reduir els comentaris brossa. Apreneu com es processen les dades dels comentaris.

Notícies més llegides

  • Un telèfon mòbil amb l'aplicació de la T-Mobilitat passant per un lector NFC d'FGC.

    T-Mobilitat: Tots els detalls del nou sistema de transport públic

    0 vegades compartit
    Share 0 Tweet 0
  • T’has cansat de Google? Quatre alternatives al cercador més popular

    0 vegades compartit
    Share 0 Tweet 0
  • AINA facilita el processament automàtic del llenguatge natural en català

    0 vegades compartit
    Share 0 Tweet 0
  • Logitec MX Vertical: el nou ratolí ergonòmic

    0 vegades compartit
    Share 0 Tweet 0
  • Assassin’s Creed III Remastered, un videojoc de primer nivell amb segell català

    0 vegades compartit
    Share 0 Tweet 0
El Tecnològic

El Tecnològic neix rere el llegat de PCatalà, un mitjà amb més de 7 anys d'experiència en el sector de les noves tecnologies i videojocs. Amb objectiu de promoure la consulta de notícies en català pretén ser el mitjà català de referència en el sector de les noves tecnologies, videojocs i dispositius mòbils.

  • Qui som?
  • Contacta
  • Política de Cookies
  • Política de privacitat

© 2019 El Tecnològic - L’actualitat tecnològica, en català.

No Result
View All Result
  • Mòbils
  • Videojocs
  • Smart Cities
  • Proximitat
  • Podcast

© 2019 El Tecnològic - L’actualitat tecnològica, en català.

Hola!

Espai restringit per a editors.

No recordeu la contrasenya?

Create New Account!

Fill the forms below to register

All fields are required. Iniciar sessió

Retrieve your password

Please enter your username or email address to reset your password.

Iniciar sessió
El Tecnològic utilitza galetes pròpies i de tercers per a millorar l'experiència de l'usuari. Si continues navegant considerem que acceptes la utilització Més informació.