2. SELECCIÓN DEL CASO
SE SELECCIONÓ EL CASO DE ESTUDIO DE RECOPILAR ARTÍCULOS CIENTÍFICOS DE
DIVERSAS DISCIPLINAS Y CLASIFICARLOS EN DIFERENTES CATEGORÍAS TEMÁTICAS
UTILIZANDO APRENDIZAJE SUPERVISADO. ADEMÁS, SE UTILIZARÁ APRENDIZAJE NO
SUPERVISADO PARA IDENTIFICAR RELACIONES Y AGRUPAR AUTOMÁTICAMENTE LOS
ARTÍCULOS EN TEMAS EMERGENTES.
TEMA.
IMPLEMENTACIÓN DE MODELOS DE APRENDIZAJE SUPERVISADO Y NO SUPERVISADO PARA
AGRUPAR ARTÍCULOS CIENTÍFICOS POR TEMA.
3. Problema de investigación
El crecimiento constante de la literatura científica dificulta la búsqueda, identificación y comprensión de los avances
avances en una disciplina específica. La falta de una organización eficiente de los artículos científicos dificulta el
acceso al conocimiento y la identificación de tendencias emergentes en la investigación.
Objetivo general
Implementar modelos de aprendizaje automático para clasificar y agrupar automáticamente artículos científicos
por tema en diferentes categorías temáticas.
Objetivos específicos
Desarrollar un modelo de aprendizaje supervisado para clasificar los artículos en categorías temáticas
predefinidas.
Diseñar técnicas de aprendizaje no supervisado para identificar y agrupar automáticamente los artículos en temas
emergentes.
4. MARCO TEÓRICO
Aprendizaje supervisado y no supervisado:
aprendizaje supervisado. Es una técnica de aprendizaje automático donde el algoritmo se entrena utilizando un
conjunto de datos etiquetados.
Aprendizaje no supervisado. Es una técnica de aprendizaje automático donde el algoritmo se entrena en un conjunto de
datos sin etiquetar.
Otros tipos de aprendizaje
aprendizaje semi-supervisado. Combina elementos del aprendizaje supervisado y no supervisado, utilizando conjuntos
de datos que contienen tanto datos etiquetados como no etiquetados para el entrenamiento.
Aprendizaje por refuerzo. En este tipo de aprendizaje, un agente aprende a través de la interacción con un entorno,
tomando acciones y observando las recompensas o penalizaciones resultantes.
Aprendizaje profundo (deep learning). Se refiere a un conjunto de algoritmos de aprendizaje automático que utilizan
redes neuronales con múltiples capas para aprender representaciones de datos de alto nivel.
5. Marco metodológico
el proceso seguido para el presente estudio se basó en las siguientes fases:
Recopilación de datos.
Preprocesamiento de datos.
Aprendizaje supervisado. Entrenamiento de un modelo de clasificación utilizando algoritmos de aprendizaje
supervisado como SVM o CNN, utilizando etiquetas de categorías temáticas previamente definidas.
Aprendizaje no supervisado. Aplicación de técnicas de aprendizaje no supervisado.
Evaluación y validación.
Implementación y despliegue.
6. RECOPILACIÓN DE DATOS. Para recopilar datos relevantes para la propuesta, necesitamos una amplia variedad de
artículos científicos de diferentes disciplinas. Estos pueden ser obtenidos de diversas fuentes, como bases de
datos académicas, repositorios en línea, revistas científicas, conferencias, entre otros.
Ventajas y desventajas del aprendizaje automático
Ventajas:
1. Eficiencia en la clasificación.
2. Mejora de la precisión.
3. Identificación de tendencias
emergentes.
4. Automatización del proceso.
5. Escalabilidad.
Desventajas
1. Dependencia de los datos de
entrenamiento.
2. Interpretación opaca.
3. Necesidad de actualización continua.
4. Posible sesgo en los resultados. Costo
y recursos computacionales
7. EVALUACIÓN DEL RENDIMIENTO. Se evaluará el rendimiento de los modelos de
clasificación supervisada mediante métricas como precisión, recall y f1-score,
utilizando conjuntos de datos de prueba. Además, se realizará una evaluación
cualitativa de los resultados obtenidos mediante el aprendizaje no supervisado.
Conclusión. La implementación de técnicas de aprendizaje supervisado y no
supervisado en la recopilación y clasificación de artículos científicos por
tema ofrece una solución eficiente para organizar la literatura científica y
facilitar la identificación de tendencias emergentes. Sin embargo, es
importante abordar las limitaciones y desafíos asociados con el aprendizaje
automático para garantizar su efectividad y utilidad en la práctica científica.
8. REFLEXIÓN PERSONAL
En síntesis, las lecciones aprendidas durante el desarrollo de este proyecto proporcionan
valiosos aportes que pueden informar y mejorar futuros proyectos relacionados con la
recopilación y clasificación de artículos científicos por tema. Al prestar atención a la calidad
calidad de los datos, y la colaboración interdisciplinaria, se puede mejorar la efectividad y
la utilidad de los enfoques de aprendizaje supervisado y no supervisado en este campo.