aprendizaje automático
47 noticias
IA complica la lucha contra abusos infantiles online
La lucha contra la explotación infantil online se enfrenta a un desafío creciente: la enorme cantidad de material de abuso sexual infantil (CSAM) generado, tanto real como sintético mediante inteligencia artificial. En 2025, el Centro Nacional para Niños Desaparecidos y Explotados (NCMEC) recibió 21
IA: ¿ficción o realidad? La cultura lo distorsiona
El artículo de aphyr.com explora un tema crucial y a menudo ignorado: la falta de una comprensión cultural adecuada de los modelos de lenguaje grandes (LLMs) como ChatGPT. No se trata simplemente de la tecnología en sí, sino de cómo la sociedad la percibe y la utiliza. Actualmente, nuestras narrativ
Divergencia KL: guía para entender esta métrica clave
La divergencia KL (Kullback-Leibler) es una herramienta fundamental en teoría de la información y aprendizaje automático, pero su funcionamiento puede ser confuso debido a propiedades inusuales como su falta de simetría. Este artículo desglosa la divergencia KL a través de seis (y media) intuiciones
Buscan hobbies únicos: ¿qué pasatiempos técnicos existen?
Este hilo de discusión en Hacker News (Pregunta HN: ¿Algún Hobby Niche Interesante?) refleja una búsqueda común: encontrar un pasatiempo o proyecto técnico que sea a la vez interesante, desafiante y relativamente poco explorado. El autor, que ya ha incursionado en áreas populares como la impresión 3
Construyen robot aspirador casero por menos de $500
Este artículo describe el proyecto RoboVac, donde dos personas construyeron un robot aspirador autónomo para su hogar, en lugar de comprar uno prefabricado. El objetivo era crear un robot funcional con un presupuesto de menos de 500 dólares y una duración de batería suficiente para una semana de lim
Detectar texto de IA: la carrera por identificar contenido artificial
La creciente proliferación de textos generados por modelos de lenguaje de gran tamaño (LLM) ha desatado una carrera para desarrollar herramientas y técnicas de detección. La pregunta inicial planteada en un foro online se centra en la existencia de APIs o sistemas capaces de identificar contenido cr
IA GEN-1: Robótica da un salto cuántico
Generalist AI ha anunciado el lanzamiento de GEN-1, un modelo de inteligencia artificial que representa un avance significativo en el aprendizaje robótico. La compañía afirma que GEN-1 es el primer modelo de IA de propósito general que alcanza un nivel de dominio en tareas físicas básicas, mejorando
Microsoft forzará actualización a Windows 11 25H2
Microsoft obligará a los usuarios de Windows 11 a actualizar a la versión 25H2, incluso si actualmente están utilizando la versión 24H2. Esta medida, que se implementará a través de un sistema de actualización “inteligente” basado en aprendizaje automático, busca mantener a los dispositivos actualiz
Gemma 4 en Mac Mini: Ejecuta IA localmente
Usuarios de Mac Mini con chips Apple Silicon (M1, M2, M3, M4 o M5) ahora pueden ejecutar el modelo de lenguaje Gemma 4 26B localmente gracias a una guía publicada en GitHub. El proceso, relativamente sencillo, implica la instalación de la aplicación Ollama a través de Homebrew, que gestiona las actu
Suiza impulsa investigación de chips con estándar abierto
Suiza se está posicionando como un centro clave para la investigación de semiconductores gracias a la adopción de RISC-V, un estándar de arquitectura de conjunto de instrucciones (ISA) de código abierto. Esta iniciativa, impulsada por instituciones como el Instituto Federal de Tecnología de Zúrich (
Facebook crea agentes IA que se auto-mejoran
Facebook AI Research ha publicado HyperAgents, un sistema de agentes de inteligencia artificial con la capacidad de auto-mejorarse. El proyecto, anunciado públicamente en GitHub, permite a los agentes aprender y optimizar su rendimiento a través de la ejecución de código generado por modelos de leng
Ingenieros de IA: Nuevo programa acelera el aprendizaje
Gauntlet AI ha lanzado un nuevo programa intensivo de capacitación de diez semanas diseñado para acelerar el desarrollo de habilidades en ingeniería de IA. El programa, financiado por empresas que buscan contratar talento, se centra en la ejecución práctica y la construcción de sistemas de IA listos
Google propone medir avance hacia la IA general
La búsqueda de la Inteligencia Artificial General (AGI) – sistemas de IA con capacidades cognitivas similares a las humanas – es un objetivo ambicioso con el potencial de revolucionar la ciencia y resolver problemas globales. Sin embargo, medir el progreso hacia la AGI es un desafío considerable deb
ia: ¿por qué no aprende como nosotros?
El artículo "Why AI systems don't learn and what to do about it: Lessons on autonomous learning from cognitive science" plantea una crítica fundamental a la forma en que actualmente se construyen los sistemas de Inteligencia Artificial, argumentando que carecen de la capacidad de aprendizaje autónom
Mistral AI: Plataforma para IA a medida ya disponible
Mistral AI ha lanzado 'Forge', una nueva plataforma diseñada para permitir a las empresas crear modelos de inteligencia artificial personalizados basados en su propio conocimiento interno. A diferencia de los modelos de IA genéricos entrenados con datos públicos, Forge permite a las organizaciones e
Científicos logran avance clave en proyecto 'autolab'
Un equipo de científicos ha anunciado un avance significativo en un proyecto de investigación denominado 'autolab', logrando un resultado de 0.965377 utilizando la combinación de modelos WD081, WD013 y VEWD005. La actualización, publicada hace 47 minutos a través de un 'Live Research Feed', indica u
Robots aprenden tenis con datos limitados: un avance
LATENT es un sistema innovador que permite a robots humanoides aprender a jugar tenis, incluso con datos de entrenamiento incompletos y fragmentados. El problema que aborda es la dificultad de replicar las complejas habilidades de un jugador de tenis humano en un robot. Tradicionalmente, entrenar a
Peek: i.a. optimiza el uso de Claude Code
La startup gopeek.ai ha lanzado Peek, una herramienta que mejora significativamente la interacción con Claude Code, el modelo de lenguaje de código de Anthropic, a través del aprendizaje automático. Peek analiza las preferencias del usuario y las inyecta automáticamente en el proceso de interacción,
Doctorado: guía realista para sobrevivir
Este artículo, "A Survival Guide to a PhD" de Karpathy, ofrece una perspectiva honesta y detallada sobre la experiencia de doctorado, más allá de la visión idealizada. El objetivo principal no es convencer a la gente de hacer un doctorado, sino proporcionar una guía realista para aquellos que ya est
Verificación computacional: surge herramienta innovadora
Un nuevo sistema llamado MetaGenesis Core busca revolucionar la verificación de resultados computacionales, un problema crítico en campos como la ciencia, la simulación, el aprendizaje automático y la gestión de riesgos. Actualmente, la verificación independiente de estos resultados depende de la co
IA 'Understudy' aprende y automatiza tareas en tu escritorio
Un nuevo agente de inteligencia artificial llamado 'Understudy' ha sido desarrollado para automatizar tareas de escritorio al aprender de los usuarios. A diferencia de las herramientas de IA actuales que se centran en interfaces específicas, Understudy opera como un colega virtual, interactuando con
Avance de IA se ralentiza: ¿llegan los LLM a un límite?
Un reciente estudio realizado por Metr.org sugiere que la mejora en las capacidades de programación de los modelos de lenguaje grandes (LLM) podría haber alcanzado un punto de meseta. La investigación, publicada en entropicthoughts.com, analiza el rendimiento de los LLM en tareas de programación, co
Ukkonen: Visualizando un Algoritmo Complejo
Este artículo explora la visualización del algoritmo de Árbol de Sufijos de Ukkonen, una técnica compleja para indexar y buscar subcadenas dentro de grandes conjuntos de datos de texto. El autor, un divulgador técnico, comparte su experiencia personal en el aprendizaje de algoritmos, destacando la b
MariaDB 12.3: mejor en búsqueda vectorial que Postgres
Una reciente evaluación comparativa ha revelado que MariaDB 12.3 supera a PostgreSQL en pruebas de búsqueda vectorial, según un análisis realizado por Small Datum LLC y patrocinado por la MariaDB Foundation. Los resultados, publicados en enero y febrero de 2025, muestran que MariaDB 12.3 ofrece una
Investigación exitosa: claves para un artículo premiado
Este artículo, escrito por Nicholas Carlini, comparte su perspectiva sobre cómo llevar a cabo investigaciones de alto impacto y escribir artículos sobresalientes, basándose en su experiencia al recibir un premio al mejor artículo en EuroCrypt. El autor enfatiza que, si bien la suerte juega un papel,
Nuevo método agiliza cálculo de matrices para IA
Este artículo de Ji-Ha Kim explora un método novedoso y eficiente para calcular el factor polar de matrices, especialmente útil en el contexto de optimizadores de aprendizaje automático como Muon. El factor polar, definido como G(GᵀG)⁻¹/², es un componente esencial en la descomposición polar de una
Tensor Spy: inspecciona tensores directamente en tu navegador
Un nuevo software llamado Tensor Spy ha sido lanzado para facilitar la inspección y visualización de archivos de tensores en navegadores web. La herramienta, disponible ahora, permite a los usuarios cargar y revisar archivos .npy, .npz, .pt y .pth, formatos comunes para almacenar datos de tensores u
Algoritmos evolutivos: nueva técnica optimiza su funcionamiento
El artículo "Code World Models for Parameter Control in Evolutionary Algorithms" introduce una técnica innovadora para optimizar algoritmos evolutivos, un tipo de algoritmo de optimización inspirado en la evolución biológica. Para entender su importancia, primero debemos comprender qué son los algor
Números duales: nueva técnica mejora cálculos complejos
Un nuevo enfoque para el cálculo de derivadas, denominado 'números duales', podría resolver problemas de precisión inherentes a la aritmética de punto flotante, según un artículo publicado en campedersen.com. El método, que ha existido teóricamente desde 1964, representa un número como un par: un va
ia aprende a 'ver' como humanos: nuevo recurso en GitHub
Un repositorio de GitHub ha sido creado para clarificar la reconstrucción de la percepción visual en la inteligencia artificial, dirigido a investigadores de IA y aprendizaje automático que quizás no estén familiarizados con la neuroimagen. El recurso indexa conjuntos de datos de neuroimagen para re
Química computacional al alcance de todos con nueva web
Un investigador de la Universidad Northeastern ha desarrollado una interfaz web innovadora que democratiza el acceso a simulaciones avanzadas de química computacional, eliminando barreras tradicionales como la necesidad de instalación, conocimientos de línea de comandos o entornos de programación co
Convierte imágenes a texto: OCR online gratis
## OCR Online: Convirtiendo Imágenes y PDFs Escaneados en Texto Editable ¿Qué es y por qué es importante? Online OCR (Reconocimiento Óptico de Caracteres) es una tecnología que permite convertir imágenes, ya sean fotografías de documentos, escaneos de PDFs o archivos en formatos como JPG o PNG, en
Redes neuronales: Lean busca mayor seguridad
El auge de las redes neuronales en aplicaciones críticas, como sistemas de seguridad y control, ha revelado una brecha preocupante: la verificación y el análisis de estas redes a menudo se realizan *fuera* del entorno de programación donde se definen y ejecutan. Esta separación crea una desconexión
Ingeniero simplifica modelos GPT a 200 líneas de código
Un ingeniero ha simplificado significativamente los modelos de lenguaje grandes (LLM) como GPT, creando una versión funcional en tan solo 200 líneas de código Python. Esta hazaña, denominada 'microgpt', representa un hito en la accesibilidad y comprensión de la tecnología detrás de herramientas como
Modelos IA más pequeños logran cálculo complejo
Investigadores han logrado reducir significativamente el tamaño de los modelos transformer capaces de realizar la suma de dos números de 10 dígitos con una precisión superior al 99%, un desafío conocido como 'AdderBoard'. Inicialmente, modelos generados por Claude Code y Codex requerían 6.080 y 1.64
Jane Street busca mentes brillantes con puzzle de IA
Jane Street, una firma de trading cuantitativo, ha lanzado un desafío de aprendizaje automático (ML) único para reclutar expertos en interpretación de redes neuronales. El puzzle, disponible en Hugging Face, presenta una red neuronal con una especificación completa, incluyendo sus pesos, desafiando
Bild AI impulsa la construcción con inteligencia artificial
La startup Bild AI ha levantado una ronda de financiación inicial para revolucionar la industria de la construcción mediante el uso de inteligencia artificial. Fundada por Puneet y Roop, la empresa se enfoca en resolver los complejos desafíos relacionados con la lectura de planos, la estimación de c
IA aprende de videos: automatización más inteligente
Una nueva IA, denominada FDM-1, ha sido desarrollada para permitir que los agentes de software aprendan directamente de videos, lo que abre la puerta a una automatización más avanzada. El modelo, creado por un equipo de investigadores, se entrena con una enorme cantidad de datos de video (11 millone
Hugging Face estandariza agentes de código IA
Hugging Face ha lanzado un nuevo estándar llamado 'Skills' para facilitar la integración y uso de agentes de codificación impulsados por inteligencia artificial y aprendizaje automático. Esta iniciativa busca estandarizar la forma en que estas herramientas, como OpenAI Codex, Anthropic Claude Code,
Perro 'codifica' juegos con ayuda de la IA
Este artículo describe un proyecto innovador donde el autor enseñó a su perro, Momo, a 'codificar' juegos utilizando inteligencia artificial. La idea surgió de un incidente divertido donde Momo accidentalmente generó código en el teclado del autor, lo que lo llevó a experimentar con la posibilidad d
Steerling-8B: IA interpretable y eficiente
## Steerling-8B: IA Interpretable y Eficiente Revoluciona el Control de Modelos de Lenguaje En un avance significativo para la inteligencia artificial, Guide Labs ha presentado Steerling-8B, el primer modelo de lenguaje inherentemente interpretable capaz de rastrear cada token generado hasta su con
Shibuya: Nuevo WAF de código abierto redefine la seguridad web
Un nuevo cortafuegos de aplicaciones web (WAF) de código abierto llamado Shibuya ha sido lanzado, prometiendo un nivel de seguridad superior a las soluciones existentes, incluyendo a competidores como Cloudflare, AWS WAF y ModSecurity. Shibuya se distingue por integrar una amplia gama de funcionalid
Modelos de lenguaje: nueva técnica impulsa la velocidad
Investigadores han desarrollado una nueva técnica llamada Consistency Diffusion Language Models (CDLM) que acelera significativamente la inferencia de modelos de lenguaje de difusión (DLMs). CDLM logra hasta 14.5 veces más velocidad en tareas de matemáticas y programación, sin sacrificar la calidad
IA domina Magic: The Gathering con nueva plataforma
Investigadores han desarrollado 'mage-bench', una plataforma que permite a modelos de lenguaje extensos (LLMs) jugar Magic: The Gathering entre sí, replicando la complejidad del juego de cartas coleccionables. La plataforma, basada en el proyecto XMage, permite a los LLMs tomar decisiones sobre mull
Aprende IA, matemáticas y computación con enfoque práctico
El proyecto 'Maths, CS & AI Compendium' de Henry Ndubuaku, alojado en GitHub, representa una alternativa innovadora a los libros de texto tradicionales de matemáticas, computación e inteligencia artificial. La motivación detrás de este compendio es clara: muchos libros académicos se sumergen en la n
AGI: ¿Tan cerca está la IA humana?
El artículo explora por qué la inteligencia artificial general (AGI), o IA a nivel humano, podría no ser tan inminente como algunos CEOs de OpenAI y Anthropic sugieren. El autor, con un doctorado en Machine Learning, argumenta que los modelos de lenguaje basados en transformadores actuales tienen li
Gemini 3 Deep Think: IA para ciencia y resolución compleja
## Gemini 3 Deep Think: IA para ciencia y resolución compleja Google ha lanzado una actualización significativa de su modelo Gemini 3, denominada “Deep Think”, diseñada para impulsar la investigación científica, la ingeniería y la resolución de problemas complejos. Esta nueva versión, ya disponible
