VozPública es una plataforma avanzada de análisis computacional del discurso político que emplea inteligencia artificial y procesamiento de lenguaje natural para extraer insights de las comunicaciones oficiales de la Presidencia de México.
Servicios de IA Disponibles
🔍 Búsqueda Semántica
Encuentra fragmentos del discurso presidencial por significado, no solo por coincidencia de palabras.
Explorar Búsqueda💬 Pregunta y Respuesta (LLM)
Formula preguntas en lenguaje natural sobre el contenido de los discursos. Respuestas generadas por IA basadas en el corpus presidencial.
Hacer Preguntas📊 Evolución Narrativa
Analiza cómo conceptos políticos específicos cambian su significado semántico a través del tiempo. Detecta drift conceptual y cambios de contexto.
Ver Evolución🎯 Descubrimiento Automático de Tópicos
Identificación no supervisada de temas dominantes en el discurso presidencial usando clustering semántico y modelado de tópicos.
PróximamenteFuente de datos: Discursos presidenciales oficiales, conferencias de prensa, entrevistas y comunicados de gob.mx/presidencia
Cobertura: Octubre 2024 en adelante (Administración Claudia Sheinbaum)
¿Para quién es VozPública?
Para Analistas Políticos
Identifica cambios en prioridades gubernamentales, evolución de narrativas y patrones discursivos con precisión cuantitativa.
Para Periodistas e Investigadores
Busca declaraciones específicas, verifica contextos históricos y encuentra contradicciones o consistencias en el discurso oficial.
Para Ciudadanos Informados
Accede a análisis basados en datos sobre cómo el gobierno comunica sus políticas y comprende la evolución del discurso público.
Para Académicos
Utiliza herramientas de análisis semántico avanzado para investigación en ciencias políticas, comunicación y lingüística computacional.
Arquitectura y flujo de análisis
VozPública está diseñada como una plataforma modular de análisis semántico, capaz de procesar grandes volúmenes de discurso político y convertirlos en información consultable e interpretable.
- Ingesta automatizada de datos:Extracción continua de transcripciones oficiales desde gob.mx/presidencia, incluyendo discursos, conferencias de prensa, entrevistas y comunicados. Los datos se actualizan de forma periódica para mantener la base de conocimiento vigente.
- Procesamiento y estructuración:Limpieza del texto, segmentación en unidades discursivas y enriquecimiento con metadatos estructurados (fecha, tipo de evento, orador, contexto institucional).
- Representación semántica:Conversión de cada fragmento discursivo en representaciones vectoriales mediante modelos de lenguaje preentrenados (sentence transformers), capturando significado y contexto más allá de palabras clave.
- Almacenamiento e indexación vectorial:Persistencia en una base de datos vectorial con índices HNSW, optimizada para consultas de similitud semántica a gran escala.
- Servicios de Análisis y Consulta:Exposición de capacidades analíticas mediante APIs: búsqueda semántica, preguntas y respuestas con RAG, y análisis de evolución narrativa a través de series temporales semánticas.
Contexto del Proyecto
VozPública es un proyecto independiente de investigación y desarrollo. Forma parte de un portafolio profesional enfocado en:
- Arquitectura de sistemas de análisis de datos a gran escala
- Implementación de pipelines de ML/NLP en producción
- Diseño de interfaces para exploración de datos complejos
- Aplicación de IA a problemas de ciencias sociales y análisis político
Nota: Este es un proyecto no partidista y sin fines de lucro. El objetivo es demostrar aplicaciones tecnológicas avanzadas para análisis de discurso público.
Contacto
Si te interesa el proyecto, su enfoque técnico o posibles colaboraciones, no dudes en contactarme:
Diego Mancera
Data Engineer & AI Developer