data science
19 noticias
Tseda: Herramienta explora datos de series de tiempo
Tseda es una herramienta de código abierto (disponible en GitHub) diseñada para explorar y analizar series de tiempo regularmente muestreadas, es decir, datos que se registran a intervalos regulares (por ejemplo, cada hora, día o mes). Su principal utilidad radica en facilitar la identificación de p
Muestreo de Floyd: un algoritmo ingenioso
El algoritmo de muestreo de Floyd es una técnica ingeniosa para generar un subconjunto aleatorio de tamaño `k` de un conjunto de números del 1 al `n`. A diferencia de otros algoritmos de muestreo como el muestreo de reservorio, la intuición detrás de Floyd's Sampling no es inmediatamente obvia, lo q
IA: ¿Otro 'Gran Salto' con Riesgos?
El artículo "The AI Great Leap Forward" de Han Lee, publicado en leehanchung.github.io, advierte sobre una tendencia peligrosa en la adopción de la Inteligencia Artificial que recuerda al desastroso “Gran Salto Adelante” de China en 1958. En ese momento, Mao Zedong ordenó una producción masiva de ac
IA: ¿Ilusión o Evolución Tecnológica?
El artículo "The Future of Everything is Lies, I Guess" explora la realidad detrás de la actual ola de entusiasmo por la "Inteligencia Artificial" (IA), argumentando que lo que se conoce como IA son, en realidad, sofisticadas tecnologías de aprendizaje automático (ML) capaces de procesar y generar g
Flash-KMeans: K-Means Veloz para Sistemas Online
El algoritmo K-Means es una técnica fundamental en aprendizaje automático para agrupar datos similares. Tradicionalmente, se ha utilizado para tareas como organizar conjuntos de datos o preprocesar incrustaciones (embeddings), pero su aplicación en tiempo real, en sistemas online, ha sido limitada p
Mejora modelos IA: nuevo método optimiza Random Forest
Este artículo describe un método para optimizar las características (features) utilizadas en un Random Forest, un algoritmo de aprendizaje automático popular, con el objetivo de mejorar su rendimiento y evitar el sobreajuste (overfitting). El autor, Illya Gerasymchuk, se enfrentaba a un problema: su
IA transforma hojas de cálculo: más fácil y eficiente
Las hojas de cálculo son herramientas omnipresentes en el mundo del análisis de datos, utilizadas en prácticamente todos los sectores. Sin embargo, trabajar con ellas a menudo implica la creación de fórmulas complejas, limpieza de datos y una comprensión profunda de su estructura, tareas que son pro
Domina Pandas: 101 ejercicios interactivos
Este recurso, alojado en machinelearningplus.com, ofrece una colección interactiva de 101 ejercicios prácticos para dominar Pandas, una biblioteca fundamental de Python para el análisis y la manipulación de datos. Pandas facilita la carga, limpieza, transformación y análisis de datos tabulares, y es
Spice Data busca talento joven para su equipo
Spice Data busca un Especialista de Producto (New Grad) para unirse a su equipo en San Francisco. Pero, ¿qué significa esto y por qué es una oportunidad interesante? En esencia, Spice Data es una startup que proporciona datos de alta calidad a grandes empresas (Fortune 500) de forma continua y fiabl
Python: el misterio de 'NaN' y su comportamiento
En el mundo de la programación, especialmente en Python, a veces nos encontramos con peculiaridades que desafían nuestra intuición. Uno de estos casos, recientemente discutido en la comunidad Python, involucra a `float('nan')`, que representa el valor 'Not a Number' (No es un Número). Aunque pueda p
Claude Code: ¿Adicción o Herramienta Potente?
## Adicción a Claude Code: Explorando la Fascinación y los Límites de la Exploración de Datos con IA **Introducción: ¿Qué es Claude Code y por qué es tan atractivo?** El texto presenta una experiencia común: la adicción a Claude Code, una herramienta de Anthropic que combina la potencia de un mode
Python: Análisis A/B con tea-tasting, Pingouin y más
Este artículo compara cuatro paquetes de Python útiles para el análisis de pruebas A/B: `tea-tasting`, `Pingouin`, `statsmodels` y `SciPy`. El objetivo no es declarar un ganador absoluto, sino comprender las fortalezas de cada uno y el nivel de esfuerzo manual requerido para generar informes de prue
Roboflow busca expertos en visión artificial
Roboflow está buscando talento para construir el futuro de la visión artificial (Computer Vision). En esencia, la visión artificial es la rama de la inteligencia artificial que permite a las máquinas 'ver' e interpretar imágenes y videos, de manera similar a como lo hacen los humanos. Esto es crucia
Árboles de Decisión: Guía para entender el algoritmo
Los árboles de decisión son un algoritmo fundamental en el aprendizaje automático, utilizados para clasificación y regresión. Su atractivo radica en su interpretabilidad y eficiencia, pero comprender su funcionamiento interno requiere un poco de teoría. Este resumen explica cómo funcionan los árbole
SmartKNN: Nuevo algoritmo optimiza el aprendizaje KNN
Un nuevo algoritmo de aprendizaje llamado SmartKNN ha sido desarrollado para mejorar el rendimiento de los métodos de vecinos más cercanos (KNN). El algoritmo, creado por Thatipamula-Jashwanth y disponible en GitHub, busca superar las limitaciones de los enfoques KNN tradicionales, como el tratamien
Bitmovin: Becas de IA y Video para Estudiantes (Verano 2026)
El programa "AI & Beyond Internship Incubator" de Bitmovin (verano de 2026) es una iniciativa de formación intensiva diseñada para estudiantes y recién graduados interesados en la inteligencia artificial (IA) y sus aplicaciones, especialmente en el contexto del procesamiento de video y streaming. Au
Nueva escala evalúa el poder de procesamiento de datos
Un debate reciente en la comunidad tecnológica ha propuesto la creación de una nueva escala para medir la capacidad de procesamiento de datos, inspirada en la escala de Kardashev utilizada para clasificar civilizaciones según su dominio energético. La idea surgió durante una llamada comunitaria de M
Domina los LLM: Guía práctica con Python
Andrew P. Wheeler ha publicado un nuevo libro titulado "Modelos de Lenguaje Grandes para Mortales: Una Guía Práctica para Analistas con Python", disponible en formato físico (59,99 $) y digital (49,99 $). La obra ofrece una guía práctica para utilizar Python con los principales proveedores de modelo
PyTorch: guía esencial para aprendizaje profundo
Este artículo introduce PyTorch, un framework de aprendizaje profundo de código abierto desarrollado originalmente por Meta AI y ahora parte de la Linux Foundation. PyTorch es fundamental para el desarrollo de modelos de machine learning, y su comprensión es crucial para cualquier persona que trabaj
