modelos-de-lenguaje
4 noticias
Claude Code: Anthropic acelera con 'Fast Mode' (descuento)
Anthropic ha lanzado 'Fast Mode' para su modelo de código Claude Code, una función en fase de investigación que prioriza la velocidad de respuesta sobre la eficiencia de costes. Disponible hasta el 16 de febrero con un descuento del 50%, Fast Mode utiliza la misma calidad y capacidades del modelo Op
Libro explica RLHF: guía para IA con retroalimentación humana
Nathan Lambert ha publicado un libro introductorio sobre RLHF (Reinforcement Learning from Human Feedback), una técnica crucial para el desarrollo y despliegue de sistemas de aprendizaje automático, especialmente modelos de lenguaje. El libro está dirigido a personas con conocimientos cuantitativos
IA Gemma 3B: Ejecútala en Linux con Ollama
Usuarios de Linux ahora pueden ejecutar el modelo de inteligencia artificial Gemma 3B localmente gracias a la herramienta Ollama. La instalación, descrita como sencilla, permite a los usuarios descargar y probar modelos pre-entrenados sin necesidad de configurar entornos de desarrollo complejos. Oll
Self-Attention at Constant Cost per Token via Symmetry-Aware Taylor Approximation
Un nuevo estudio presenta una técnica para optimizar el mecanismo de autoatención en modelos Transformer, reduciendo significativamente los costos de cómputo y memoria. La investigación, basada en una aproximación de Taylor que considera la simetría de las operaciones, permite calcular la autoatenci
