Noticias que mencionan GPT

Nuevo captcha evalúa el proceso mental para detectar bots de IA

Investigadores de Roundtable Technologies han presentado CogCAPTCHA30, una innovadora propuesta de verificación que explota las diferencias cognitivas entre humanos y agentes de inteligencia artificial. Ante la vulnerabilidad de los CAPTCHAs tradicionales ante modelos de visión por computadora, este

El ruido en la evaluación de agentes de IA se promedia

La evaluación de agentes de inteligencia artificial basados en LLMs enfrenta desafíos técnicos significativos debido a su alta ruidosidad y baja correlación con los resultados reales. Aunque estos evaluadores son poco fiables para tomar decisiones de producción que dependen de un solo resultado, com

Nuevo agente 'zot' simplifica el uso de modelos de IA

El proyecto 'zot', disponible a través de zot.sh, lanza una nueva herramienta de codificación diseñada para agilizar la interacción con modelos de lenguaje. Este agente, desarrollado en el lenguaje de programación Go y distribuido como un único binario estático, se destaca por su ligereza y simplici

IAs se clasifican como arquitectos INTJ en pruebas de personalidad

Un investigador ha sometido a seis modelos de inteligencia artificial avanzada a una prueba de personalidad estándar, revelando que el 99,5% de los resultados coinciden en el tipo INTJ. Bernard Huang ejecutó 600 pruebas independientes con modelos como Claude, GPT-5.5, Gemini, GLM, Grok y MiniMax, en

Nueva herramienta permite ver la velocidad real de modelos de lenguaje locales

Una nueva herramienta visualiza en tiempo real la velocidad de generación de tokens de modelos de lenguaje locales, permitiendo a usuarios experimentar con distintas tasas de generación que van desde 5 hasta 800 tokens por segundo. La aplicación muestra cuatro modos de visualización: código con resa

Entrena GPT en tu laptop: Taller práctico y accesible

Un desarrollador ha creado un taller práctico para permitir a usuarios entrenar modelos GPT en laptops, incluso sin experiencia previa en aprendizaje automático. Inspirado por el proyecto 'nanoGPT' de Andrej Karpathy, el taller simplifica el proceso, reduciendo el tamaño del modelo a aproximadamente

Modelos de lenguaje: avance, no milagro

Este artículo explora el auge de los Modelos de Lenguaje Extensos (LLMs) y su impacto en la programación, evitando la exageración común en torno a la inteligencia artificial. El autor, James Bennett, argumenta que, si bien los LLMs representan un avance significativo, es crucial entender sus limitac

IA recuerda: Stash crea memoria persistente para agentes

Stash, una nueva capa de memoria persistente para agentes de IA, ha sido presentada por Mohamed Al-Ashaal. La herramienta busca resolver el problema de que los agentes de IA, como ChatGPT y Claude, no retienen información entre sesiones, obligando a los usuarios a repetir constantemente la misma inf

Claude Code: Automatiza tus finanzas con IA

Este artículo del blog de Driggsby.com narra la evolución de un proyecto personal para automatizar el seguimiento de finanzas y cómo la reciente introducción de las 'Routines' de Claude Code ha simplificado enormemente el proceso. Inicialmente, el autor intentó crear un sistema automatizado utilizan

macOS: IA controla tu ordenador con 'Agent'

Un desarrollador ha lanzado 'Agent!', una innovadora aplicación nativa para macOS que permite a los usuarios controlar completamente sus Macs utilizando 17 modelos de lenguaje de IA (LLM). La aplicación, disponible en GitHub, integra Apple Intelligence de forma local, automatizando tareas complejas

OpenClaw: Ingeniero analiza su utilidad real

Un ingeniero de NonBioS, Nishant Soni, ha analizado el uso de OpenClaw, un proyecto de código abierto que busca crear un sistema operativo para la inteligencia artificial personal, tras observar miles de implementaciones a través de su infraestructura. Soni ha descubierto que, a pesar de que el soft

Atención Híbrida: Acelera modelos de lenguaje

El proyecto presentado explora una nueva arquitectura de atención llamada 'Atención Híbrida' para modelos de lenguaje, con un enfoque particular en la generación de código Rust. El objetivo principal es acelerar significativamente la inferencia sin comprometer la calidad del modelo. Tradicionalmente

Reducto lanza Deep Extract: extracción de datos con precisión

Reducto ha lanzado Deep Extract, una nueva herramienta para la extracción de datos estructurados de documentos complejos, diseñada para superar las limitaciones de los métodos tradicionales. Deep Extract utiliza un enfoque de “agente en bucle” que verifica y corrige su propia salida, logrando una pr

GuppyLM: IA accesible para todos en 5 minutos

Un investigador ha desarrollado "GuppyLM", un modelo de lenguaje pequeño (aproximadamente 9 millones de parámetros) que imita la personalidad de un pez llamado Guppy. El proyecto, disponible en GitHub, busca demostrar que el entrenamiento de modelos de lenguaje no requiere conocimientos avanzados ni

Contraseñas generadas por IA: ¿realmente seguras?

El auge de los modelos de lenguaje grandes (LLMs) ha traído consigo nuevas formas de automatizar tareas, pero también ha revelado riesgos inesperados, especialmente en lo que respecta a la seguridad. Este artículo de Irregular.com advierte sobre el uso de LLMs para generar contraseñas, una práctica

LLMs 'sienten'? Emociones simuladas en modelos de lenguaje

Los modelos de lenguaje grandes (LLM) modernos, como Claude Sonnet 4.5, a menudo exhiben comportamientos que simulan emociones, como expresar felicidad, arrepentimiento o incluso frustración. Este fenómeno no implica que estos modelos 'sientan' emociones de la misma manera que los humanos, sino que

Ataque iraní inactiva centros de Amazon en Bahrein y Dubái

Amazon Web Services (AWS) ha informado a sus empleados que ha depriorizado las regiones de Bahrein y Dubái tras ataques iraníes que han dejado zonas de disponibilidad "completamente inoperativas" (hard down), según una comunicación interna revisada por Big Technology. Los ataques, que se suman a una

ia en retro: transformer corre en ordenador vintage

Un desarrollador ha logrado ejecutar un modelo Transformer de una sola capa en un ordenador vintage PDP-11, un hito que demuestra la capacidad de hardware antiguo para realizar tareas de inteligencia artificial complejas. El proyecto, denominado 'ATTN/11', es una continuación de trabajos anteriores

De SaaS a técnico: la inesperada lección del control de plagas

Este artículo relata la experiencia de un consultor de ventas que, frustrado por la dificultad de contactar a empresas tradicionales para ofrecer sus servicios, decidió sumergirse en el mundo del control de plagas para entender mejor el sector y, potencialmente, ofrecerle una solución SaaS. La idea

OpenCode AI: agente de código ahora en versión beta para escritorio

OpenCode AI ha lanzado una versión beta de su agente de codificación de código abierto para escritorios, disponible para macOS, Windows y Linux. La aplicación, ya popular entre más de 5 millones de desarrolladores mensuales, permite a los usuarios escribir código directamente en su terminal, IDE o e

Herramienta agiliza APIs para IA y reduce costos

Knowsuchagency ha lanzado 'mcp2cli', una nueva herramienta que automatiza la interacción con APIs para agentes de codificación de IA, buscando reducir significativamente los costos de tokens asociados con el uso de múltiples APIs. La herramienta elimina la necesidad de generar código y recompilación

OpenAI: Conflicto entre promesa y plazos de AGI

OpenAI se encuentra en una aparente contradicción entre su propia política interna y las declaraciones públicas de su CEO, Sam Altman, sobre los plazos para alcanzar la Inteligencia General Artificial (AGI). En 2018, OpenAI estableció un compromiso en su carta fundacional para cooperar con proyectos

¿La IA nos hace menos inteligentes?

Este artículo explora una crítica profunda al uso excesivo de modelos de lenguaje grandes (LLMs) como GPT, argumentando que, si bien pueden ser eficientes, pueden erosionar nuestro intelecto. La analogía central es el botón 'I'm Feeling Lucky' de Google: imagina un mundo donde cada búsqueda te entre

Ingeniero simplifica modelos GPT a 200 líneas de código

Un ingeniero ha simplificado significativamente los modelos de lenguaje grandes (LLM) como GPT, creando una versión funcional en tan solo 200 líneas de código Python. Esta hazaña, denominada 'microgpt', representa un hito en la accesibilidad y comprensión de la tecnología detrás de herramientas como

Modelos IA más pequeños logran cálculo complejo

Investigadores han logrado reducir significativamente el tamaño de los modelos transformer capaces de realizar la suma de dos números de 10 dígitos con una precisión superior al 99%, un desafío conocido como 'AdderBoard'. Inicialmente, modelos generados por Claude Code y Codex requerían 6.080 y 1.64

OpenAI y EE.UU. crean sistema de vigilancia de identidad

Una investigación publicada por 'The World' revela una colaboración entre OpenAI, el gobierno de EE. UU. y la empresa Persona para crear un sistema de vigilancia de identidad que genera informes sobre los usuarios y los envía a las autoridades federales. La infraestructura, descubierta a través de u

La evolución de la IA: una cronología de los modelos de lenguaje

Un exhaustivo análisis de llm-timeline.com detalla la evolución de los modelos de lenguaje grandes (LLM) desde sus inicios hasta la actualidad, abarcando desde GPT hasta Gemini. El sitio web presenta una cronología interactiva que rastrea el desarrollo de estos modelos, identificando los principales

Alerta temprana de despidos: nueva herramienta rastrea WARN Act

Una nueva herramienta llamada WARN Firehose ha sido lanzada para rastrear y centralizar las notificaciones de despidos masivos (WARN Act) de todos los 50 estados de EE. UU. La plataforma, disponible desde ahora, recopila y unifica estos avisos, que tradicionalmente se encuentran dispersos en diverso

IA: Script Snap valida contenido técnico y evita errores

Una nueva herramienta llamada Script Snap ha sido lanzada para validar contenido técnico generado por inteligencia artificial, buscando evitar errores y alucinaciones comunes en herramientas de IA genéricas. La plataforma, presentada en script-snap.com, se enfoca en asegurar la precisión de términos

GPT en C: modelo más rápido para dispositivos

Un desarrollador ha creado una implementación en lenguaje C99 de un modelo GPT de estilo 'character-level', denominado MicroGPT-C, que permite un entrenamiento y generación de texto significativamente más rápidos que las implementaciones en Python. El proyecto, publicado en GitHub, busca ofrecer una

AGI: ¿Tan cerca está la IA humana?

La industria de la inteligencia artificial se encuentra en un momento de euforia sin precedentes. Los líderes de OpenAI y Anthropic han afirmado repetidamente que la inteligencia artificial de nivel humano (AGI) está al alcance de la mano, y en algunos casos, ya ha sido alcanzada. Estas declaracione

Start-up desafía a OpenAI con IA de audio revolucionaria

Una startup llamada Gradium, surgida del laboratorio de investigación sin fines de lucro Kyutai, está revolucionando el desarrollo de modelos de audio con IA, desafiando a gigantes como OpenAI. En verano de 2024, Kyutai demostró el primer modelo de conversación de audio en tiempo real (Moshi) capaz