Estudiamos la viabilidad y capacidad del algoritmo de diferencia temporal del núcleo (KTD)(λ) para la decodificación neuronal. El KTD(λ) es un algoritmo de aprendizaje online basado en el kernel, que ha sido introducido para estimar funciones de valor en el aprendizaje por refuerzo. Este algoritmo combina representaciones basadas en kernels con el enfoque de diferencias temporales para el aprendizaje. Una de nuestras principales observaciones es que al utilizar núcleos estrictamente definidos positivos, se puede garantizar la convergencia del algoritmo para la evaluación de políticas. Las capacidades de aproximación funcional no lineal del algoritmo se muestran tanto en simulaciones de evaluación de políticas como en problemas de decodificación neuronal (mejora de políticas). KTD puede manejar estados neuronales de alta dimensión que contienen información espacio-temporal con una complejidad computacional razonable que permite aplicaciones en tiempo real. Cuando el algoritmo busca un mapeo adecuado entre los estados neuronales de un mono y las posiciones deseadas de un cursor de ordenador o de un brazo robótico, tanto en experimentos de bucle abierto como de bucle cerrado, puede aprender eficazmente el mapeo de estado neuronal a acción. Por último, una visualización del proceso de coadaptación entre el decodificador y el sujeto muestra las capacidades del algoritmo en las interfaces cerebro-máquina de aprendizaje por refuerzo.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Óxidos metálicos nanocristalinos para sensores de metano: Papel de los metales nobles
Artículo:
Microestructura y propiedades térmicas y funcionales de películas biodegradables producidas con zeína
Artículo:
Evaluación de la seguridad in vitro y estudios de imagen in vivo de nanopartículas superparamagnéticas de óxido de hierro mediante modificación biomimética
Artículo:
Estudio teórico de las propiedades fotoeléctricas de una clase de copolímeros basados en el benzoditiofeno para células solares
Artículo:
Integración de InSAR multibanda y mediciones de nivelación para analizar el hundimiento de la superficie del túnel de escudo en el ferrocarril de alta velocidad Pekín-Zhangzhou.
Libro:
Metodología del marco lógico para la planificación, el seguimiento y la evaluación de proyectos y programas
Presentación:
Estudio de movimientos y tiempos
Artículo:
Estudio sobre la evaluación de la sostenibilidad de los productos innovadores
Tesis:
Materiales y prácticas de construcción sostenible