En el escenario en línea de toma de decisiones, un jugador tiene que escoger entre un conjunto de decisiones disponibles y, tras ello, incurre en una pérdida correspondiente a la calidad de la opción elegida. El paradigma de la minimización de arrepentimiento (regret minimization) sugiere la meta de causar una pérdida promedio que se acerque a la mejor decisión fijada a posteriori. Recientemente las herramientas de la optimización convexa han dado lugar a algoritmos que son más generales, unifican resultados previos y con frecuencia brindan límites de arrepentimiento nuevos y mejorados.
En este documento se estudian algunos de los desarrollos recientes en esta fusión entre la optimización y el aprendizaje. Se comienza describiendo dos plantillas generales para producir algoritmos y validar límites de arrepentimiento. Las plantillas son muy simples y unifican el análisis de varios algoritmos bien conocidos y utilizados.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Análisis cualitativo fundamentado en árbol de decisiones de regímenes de operación en procesos industriales de producción
Presentación:
Estudio del trabajo
Video:
Programación dinámica para el problema de la ruta más corta
Artículo:
Aplicación de algoritmos genéticos para la programación de tareas en una celda de manufactura
Libro:
Progresos en la teoría de juegos y sus aplicaciones
Artículo:
Creación de empresas y estrategia : reflexiones desde el enfoque de recursos
Artículo:
Importancia, manejo y control de extraíbles e incrustaciones (pitch) en la fabricación de papel
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores
Libro:
Planta de tratamiento de aguas residuales