pytorch
software · 28 menciones
Noticias que mencionan pytorch
Google mejora su modelo de predicción de series temporales
Google Research ha lanzado TimesFM 2.5, una versión mejorada de su modelo de predicción de series temporales. El modelo, disponible en GitHub, se basa en una arquitectura 'decoder-only' y está diseñado para ofrecer pronósticos más precisos y eficientes. TimesFM 2.5 reduce el número de parámetros de
IA en chips: CERN filtra datos del LHC en tiempo real
El CERN, el laboratorio europeo de física de partículas, está utilizando modelos de inteligencia artificial (IA) extremadamente pequeños, grabados directamente en chips de silicio, para filtrar en tiempo real los enormes volúmenes de datos generados por el Gran Colisionador de Hadrones (LHC). El LHC
tinygrad impulsa el aprendizaje profundo con $5M y tinybox
La empresa tinygrad ha recibido una financiación de 5 millones de dólares y ha lanzado 'tinybox', un potente ordenador diseñado para el aprendizaje profundo. Tinygrad, un framework de redes neuronales de rápido crecimiento, se destaca por su simplicidad y eficiencia. La nueva financiación permitirá
AtnRes: Nueva técnica optimiza modelos de lenguaje
Attention Residuals (AttnRes) es una innovadora técnica que optimiza las conexiones residuales en los Transformers, una arquitectura fundamental en modelos de lenguaje grandes (LLMs) como GPT. Tradicionalmente, las conexiones residuales simplemente suman la salida de cada capa con una ponderación u
Karaoke IA: Nightingale mejora tu experiencia cantando
Nightingale, una nueva aplicación de karaoke, ha lanzado una versión innovadora que utiliza inteligencia artificial para ofrecer una experiencia de canto mejorada. Disponible para Linux, macOS y Windows, la aplicación separa las voces de la instrumentación de las canciones utilizando modelos como UV
IA optimiza GPUs: nuevo agente agiliza el rendimiento
RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut
Entrenar IA de código abierto: desafíos inesperados
Un ingeniero de Workshop Labs, Addie Foote, relata los desafíos encontrados al intentar entrenar y servir modelos de lenguaje grandes con pesos abiertos, específicamente el modelo Kimi-K2-Thinking de Moonshot AI. El objetivo era post-entrenar el modelo, que cuenta con 1 billón de parámetros y está c
Python 3.15: Importaciones 'lazy' Resuelven Problemas de Rendimiento
Python está introduciendo una nueva característica, `lazy`, en su versión 3.15, que permite la carga diferida de módulos, resolviendo un problema de rendimiento que afectaba a empresas como Instagram y Hudson River Trading. Estas compañías, enfrentando tiempos de inicio lentos en sus herramientas de
IA investiga y optimiza modelos de lenguaje sola
Este repositorio de GitHub, creado por Andrej Karpathy, presenta un enfoque innovador para la investigación en inteligencia artificial: la 'autoresearch'. En lugar de la investigación tradicional, donde humanos modifican el código, este sistema permite a agentes de IA experimentar y optimizar modelo
Tensor Spy: inspecciona tensores directamente en tu navegador
Un nuevo software llamado Tensor Spy ha sido lanzado para facilitar la inspección y visualización de archivos de tensores en navegadores web. La herramienta, disponible ahora, permite a los usuarios cargar y revisar archivos .npy, .npz, .pt y .pth, formatos comunes para almacenar datos de tensores u
IA al estilo cerebro: ¿fin de las matrices?
Investigadores están reevaluando la dependencia de las redes neuronales artificiales en las matemáticas matriciales, inspirándose en cómo funciona el cerebro humano. El artículo explora cómo el cerebro procesa la información a través de una combinación de percepción de arriba hacia abajo (predicción
CPU innovadora opera dentro de una GPU
Investigadores han desarrollado una CPU innovadora que opera completamente dentro de una GPU, eliminando la necesidad de interacción con la CPU principal del sistema. Este prototipo, denominado NeuralCPU, ejecuta instrucciones ARM64 reales y utiliza tensores de PyTorch para almacenar registros, memo
Talos: Nuevo Hardware Acelera Redes Neuronales
Un equipo de ingenieros ha desarrollado 'Talos', un acelerador de hardware personalizado basado en FPGA diseñado para ejecutar redes neuronales convolucionales (CNN) con una eficiencia extrema. A diferencia de las implementaciones de software tradicionales, Talos elimina la sobrecarga de tiempo de e
Redes neuronales: Lean busca mayor seguridad
El auge de las redes neuronales en aplicaciones críticas, como sistemas de seguridad y control, ha revelado una brecha preocupante: la verificación y el análisis de estas redes a menudo se realizan *fuera* del entorno de programación donde se definen y ejecutan. Esta separación crea una desconexión
Joven indio sorprende con IA y juego de Doom con QR
Un joven desarrollador indio de 19 años, Kuber Mehta, está generando gran atención internacional por sus innovadoras creaciones en inteligencia artificial y desarrollo web. Destacado por *The Independent* y otros medios como *PC Gamer*, *Yahoo News* y *Boing Boing*, Mehta ha desarrollado una amplia
Python y Monorepos: Una Nueva Era para Desarrolladores
Este artículo explora el concepto de 'monorepos' en el contexto del desarrollo de Python, un enfoque que organiza múltiples proyectos relacionados en un único repositorio. Tradicionalmente, los monorepos eran difíciles de mantener debido a la complejidad de gestionar dependencias y la necesidad de h
Jane Street busca mentes brillantes con puzzle de IA
Jane Street, una firma de trading cuantitativo, ha lanzado un desafío de aprendizaje automático (ML) único para reclutar expertos en interpretación de redes neuronales. El puzzle, disponible en Hugging Face, presenta una red neuronal con una especificación completa, incluyendo sus pesos, desafiando
C++ acelera reconocimiento de voz con modelo Parakeet
Un equipo de desarrolladores ha creado una implementación en C++ de los modelos de reconocimiento de voz Parakeet de Nvidia, ofreciendo una mejora significativa en la velocidad para su ejecución en dispositivos. El proyecto, alojado en GitHub, utiliza la biblioteca de tensores ligera axiom, que incl
SciPy: Nueva herramienta para correlaciones complejas
La función `scipy.stats.chatterjeexi` en SciPy calcula el coeficiente de correlación xi y realiza una prueba de independencia entre dos conjuntos de datos. Es una herramienta valiosa porque, a diferencia de las correlaciones de Pearson o Spearman, es efectiva incluso cuando la relación entre las var
IA facilita verificación de código Python
Investigadores han desarrollado 'a3-python', una herramienta de verificación de programas para Python impulsada por inteligencia artificial. Python, a pesar de su amplio uso tanto por humanos como por modelos de lenguaje grandes (LLMs), ha sido históricamente difícil de verificar formalmente. El equ
IA: Script Snap valida contenido técnico y evita errores
Una nueva herramienta llamada Script Snap ha sido lanzada para validar contenido técnico generado por inteligencia artificial, buscando evitar errores y alucinaciones comunes en herramientas de IA genéricas. La plataforma, presentada en script-snap.com, se enfoca en asegurar la precisión de términos
GPT en C: modelo más rápido para dispositivos
Un desarrollador ha creado una implementación en lenguaje C99 de un modelo GPT de estilo 'character-level', denominado MicroGPT-C, que permite un entrenamiento y generación de texto significativamente más rápidos que las implementaciones en Python. El proyecto, publicado en GitHub, busca ofrecer una
PyTorch: guía esencial para aprendizaje profundo
Este artículo introduce PyTorch, un framework de aprendizaje profundo de código abierto desarrollado originalmente por Meta AI y ahora parte de la Linux Foundation. PyTorch es fundamental para el desarrollo de modelos de machine learning, y su comprensión es crucial para cualquier persona que trabaj
Ocr sin servidor: 40 líneas de código lo hacen posible
Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota
Heretic: herramienta elimina censura de IA automáticamente
Un nuevo conjunto de herramientas llamado Heretic está automatizando la eliminación de restricciones de seguridad (censura) de modelos de lenguaje basados en transformadores, sin necesidad de costosos procesos de reentrenamiento. Desarrollado por P-E-W y disponible en GitHub, Heretic combina técnica
Copapy: Python redefine la computación embebida
Un nuevo framework de Python llamado Copapy ha sido desarrollado para facilitar la computación en tiempo real determinista y de baja latencia en sistemas embebidos. Inspirado en frameworks de IA como PyTorch y JAX, Copapy busca ofrecer la flexibilidad de Python con el rendimiento de código máquina o
ACE-Step: Música IA de Código Abierto Desafía a la Industria
Un equipo de investigadores ha presentado ACE-Step v1.5, un modelo de música de código abierto que rivaliza con alternativas comerciales y puede ejecutarse en hardware de consumo. El modelo, disponible en GitHub, Hugging Face y ModelScope, destaca por su eficiencia, generando canciones completas en
Owning a $5M data center
Comma.ai, una empresa de conducción autónoma, ha publicado un artículo detallando cómo opera su propio centro de datos de 5 millones de dólares, en lugar de depender de servicios en la nube. Argumentan que tener control sobre su propia infraestructura de computación fomenta una mejor ingeniería, inc
