TinyEmo: Scaling down Emotional Reasoning via Metric Projection
Gutierrez Gomez, Cristian
Lapedriza i Garcia, Àgata, dir.
Bustos, Cristina, dir.
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Data: 2024
Resum: TinyEmo is a family of small multi-modal LLMs for emotional reasoning and classification. Our approach features: (1) a synthetic emotional instruct dataset for both pre-training and fine-tuning stages, (2) a Metric Projector that delegates classification from the language model allowing for more efficient training and inference, (3) a multi-modal LLM for emotional reasoning, and (4) a semi-automated framework for bias detection. TinyEmo is able to perform emotion classification and reasoning using substantially fewer parameters, with our smallest model (700M parameters) outperforming larger models based on general-purpose MM-LLMs with over 7B parameters. We release code, models, and dataset at https://github. com/ggcr/TinyEmo.
Resum: TinyEmo és un conjunt de LLMs multi-modals per classificació i raonament emocional. Les nostres aportacions inclouen: (1) un dataset sintètic emocional per les etapes de pre-entrenament i fine-tune, (2) un Metric Projector que delega la classificació del LLM permetent un entrenament més eficient, (3) un LLM multi-modal pel raonament emocional, i (4) un framework semi-automatitzat per a la detecció de biaixos. TinyEmo és capaç de fer classificació i raonament utilitzant substancialment menys paràmetres, amb el nostre model més petit (700M paràmetres) superant LLMs MM d'ús general amb més de 7B paràmetres. Codi, models i dataset disponible a: https://github. com/ggcr/TinyEmo.
Drets: Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre i quan aquestes es distribueixin sota la mateixa llicència que regula l'obra original i es reconegui l'autoria. Creative Commons
Llengua: Anglès
Titulació: Visió per Computador / Computer Vision [4314099]
Pla d'estudis: Màster Universitari en Visió per Computador/Computer Vision [1172]
Document: Treball de fi de postgrau
Matèria: Computació afectiva ; Anàlisi de sentiment visual ; Model de llenguatge multimodal ; Affective Computing ; Visual Sentiment Analysis ; Multi-modal LLM ; Visual Question Answering ; Visual Instruction Tuning



Disponible a partir de: 2025-10-29
TFG

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Enginyeria. TFM

 Registre creat el 2024-10-03, darrera modificació el 2025-01-26



   Favorit i Compartir