análisis de datos
38 noticias
Tseda: Herramienta explora datos de series de tiempo
Tseda es una herramienta de código abierto (disponible en GitHub) diseñada para explorar y analizar series de tiempo regularmente muestreadas, es decir, datos que se registran a intervalos regulares (por ejemplo, cada hora, día o mes). Su principal utilidad radica en facilitar la identificación de p
DuckDB: Curso revela los secretos de su diseño
DuckDB ha emergido como una base de datos analítica en memoria de alto rendimiento, diseñada para ser incrustada directamente en aplicaciones. Su popularidad radica en su simplicidad, velocidad y capacidad para operar con datos sin la necesidad de un servidor dedicado, lo que la hace ideal para anál
Compra online, avalancha de emails: ¿te pasa a ti?
El comercio electrónico ha revolucionado la forma en que compramos, ofreciendo comodidad y acceso a una amplia gama de productos. Sin embargo, una práctica cada vez más común que está erosionando esta experiencia positiva es la avalancha de correos electrónicos que acompañan a una compra online. El
Convexly: Analiza y Mejora Tus Decisiones Empresariales
Convexly, una startup, ha lanzado una plataforma de análisis de decisiones diseñada para ayudar a fundadores y líderes a cuantificar y mejorar su toma de decisiones. La plataforma, que se describe como un “fitness tracker para la toma de decisiones”, permite a los usuarios registrar decisiones en 30
Hoja de cálculo en terminal: así es sc-im
sc-im es una calculadora de hojas de cálculo innovadora, diseñada para funcionar directamente en la terminal. Inspirada en el proyecto original 'sc' de James Gosling y Mark Weiser, y con mejoras de Chuck Martin, sc-im ofrece una alternativa potente y flexible a las hojas de cálculo tradicionales, es
Plataforma unifica recursos para investigaciones OSINT
Una nueva plataforma, desarrollada por la comunidad para la comunidad, ha sido lanzada para centralizar herramientas y recursos de Inteligencia de Fuentes Abiertas (OSINT). La plataforma, cuyo nombre no se especifica en la fuente, busca facilitar investigaciones OSINT al organizar herramientas por c
Gmail: Identifica remitentes que llenan tu bandeja
Un usuario de Gmail ha descubierto que la mayoría del 'bloat' (correo basura o innecesario) en su bandeja de entrada no provenía de archivos adjuntos grandes, sino de un pequeño número de remitentes. A través de una herramienta llamada 'mailtrim', el usuario identificó que tan solo tres remitentes e
SQLite: nuevas herramientas para datos y búsquedas
SQLite, una base de datos embebida ampliamente utilizada, ha incorporado recientemente una serie de potentes nuevas funcionalidades que amplían significativamente sus capacidades. Estas mejoras, disponibles en versiones modernas de SQLite, incluyen soporte nativo para el manejo y consulta de datos J
Críticas a la 'Iglesia de los Gráficos': ¿Datos vs. Experiencia?
Este artículo critica una tendencia intelectual, denominada "La Iglesia de los Gráficos", que prioriza los datos cuantificables y las estadísticas oficiales por encima de la experiencia personal y la observación directa. El autor, Kitten, aunque admirador del pensador Scott Alexander (quien es prese
Lime revela datos personales: un análisis innovador
Este artículo, escrito por Boris Starkov, explora una forma innovadora de analizar datos personales utilizando el Reglamento General de Protección de Datos (RGPD) y modelos de lenguaje avanzados como Claude. El autor, un usuario intensivo de bicicletas Lime en Londres durante tres años, solicitó a L
Estadística Bayesiana: Guía para científicos de datos
Este artículo explica de manera didáctica las estadísticas bayesianas, un tema que a menudo resulta confuso para los científicos de datos. La estadística bayesiana se presenta como una alternativa a la estadística frecuentista, una metodología dominante pero a veces carente de intuición. La principa
25 años rastreando el precio de los huevos
Este artículo relata un proyecto personal de 25 años para rastrear el precio de los huevos a través de recibos escaneados, utilizando tecnologías de vanguardia como agentes de codificación con IA (Codex y Claude) y modelos de visión por computadora. El autor comenzó en 2001 guardando imágenes de rec
La curva de campana: ¿por qué es tan común?
El artículo de Quanta Magazine explora el origen y la importancia del Teorema del Límite Central (TLC), un principio matemático fundamental que explica por qué la curva de campana (distribución normal) aparece tan frecuentemente en diversos conjuntos de datos. La curva de campana, esa forma suave y
Hacker News: archivo completo ahora es un conjunto de datos
Hugging Face ha puesto a disposición un extenso conjunto de datos del archivo completo de Hacker News, abarcando desde 2006 hasta marzo de 2026. Este recurso, que incluye cada historia, comentario, pregunta, oferta de trabajo y encuesta publicada en la plataforma, se actualiza cada cinco minutos. Ha
Estudio: Limitar precios hospitalarios podría ahorrar $73 mil millones
Un análisis reciente publicado en GitHub por Rexrodeo ha identificado el potencial de ahorrar $73 mil millones anuales en costos de atención médica en Estados Unidos al limitar los precios que los hospitales cobran a las aseguradoras comerciales. El estudio, que utiliza datos públicos primarios y es
Corrupción: mayor impacto en la confianza democrática
Este estudio explora una paradoja intrigante: la corrupción, aunque presente en democracias y autocracias, parece tener un impacto desproporcionado en la confianza social en los primeros. La investigación, basada en datos de 62 países y análisis individualizados, revela que la percepción de corrupci
Aprendizaje automático: cómo las máquinas aprenden
Este artículo introduce de manera visual y accesible el concepto de Aprendizaje Automático (AA). En esencia, el AA permite a las computadoras identificar patrones en datos para realizar predicciones precisas. El ejemplo concreto utilizado es la distinción entre casas ubicadas en Nueva York y San Fra
Analizan el Dólar: Modelo Cuantitativo para Divisas
Este artículo, escrito por Dean Markwick, explora cómo construir un modelo cuantitativo para analizar el comportamiento de las divisas, específicamente utilizando el Índice del Dólar Estadounidense (DXY) como referencia. El autor, con experiencia en trading cuantitativo, busca aplicar técnicas de in
Rudel: Análisis Detallado para Usuarios de Claude Code
Un nuevo software llamado Rudel ha sido lanzado para proporcionar análisis detallados de las sesiones de codificación realizadas con Claude Code, el modelo de Anthropic. La herramienta, disponible gratuitamente en rudel.ai, ofrece un panel de control con información sobre el uso de tokens, duración
Avance de IA se ralentiza: ¿llegan los LLM a un límite?
Un reciente estudio realizado por Metr.org sugiere que la mejora en las capacidades de programación de los modelos de lenguaje grandes (LLM) podría haber alcanzado un punto de meseta. La investigación, publicada en entropicthoughts.com, analiza el rendimiento de los LLM en tareas de programación, co
Investigación exitosa: claves para un artículo premiado
Este artículo, escrito por Nicholas Carlini, comparte su perspectiva sobre cómo llevar a cabo investigaciones de alto impacto y escribir artículos sobresalientes, basándose en su experiencia al recibir un premio al mejor artículo en EuroCrypt. El autor enfatiza que, si bien la suerte juega un papel,
Vigilancia digital: simple acceso, gran poder
Este artículo de Benn Stancil explora la sorprendente banalidad de la vigilancia en la era digital. Contrario a la imagen de sistemas complejos y sofisticados, la vigilancia efectiva a menudo se reduce a la capacidad de un empleado con acceso a datos de uso para realizar consultas relativamente senc
IA y empleo: nueva métrica evalúa el impacto real
Este informe de Anthropic.com analiza el impacto potencial de la inteligencia artificial (IA) en el mercado laboral, presentando una nueva métrica llamada 'exposición observada' para medirlo. A diferencia de enfoques anteriores que sobreestimaron la vulnerabilidad laboral (como la medición de 'offsh
SitDeck: Datos en Tiempo Real Gratuitos con IA
Una nueva plataforma de inteligencia de código abierto llamada SitDeck ha sido lanzada, ofreciendo acceso gratuito a datos en tiempo real sobre una amplia gama de temas, incluyendo conflictos, terremotos, mercados y amenazas. La plataforma, disponible en sitdeck.com, integra más de 180 proveedores d
Desayuno Matemático: Un Universo de Huevos y Leche
Este artículo, escrito de forma humorística y con un toque de ciencia ficción, explora la idea de que el desayuno, aparentemente simple, puede ser un concepto sorprendentemente complejo cuando se analiza desde una perspectiva matemática. El autor, Ryan Moulton, comienza con una idea disparatada surg
SciPy: Nueva herramienta para correlaciones complejas
La función `scipy.stats.chatterjeexi` en SciPy calcula el coeficiente de correlación xi y realiza una prueba de independencia entre dos conjuntos de datos. Es una herramienta valiosa porque, a diferencia de las correlaciones de Pearson o Spearman, es efectiva incluso cuando la relación entre las var
HN: Cuentas nuevas usan símbolos, alerta de bots
HN: Cuentas nuevas usan símbolos, alerta de bots En las últimas semanas, la comunidad de Hacker News (HN), una plataforma de discusión popular entre programadores y entusiastas de la tecnología, ha expresado una creciente preocupación por una posible inundación de cuentas automatizadas, o 'bots'. L
ia descubre secretos del diseño web japonés
Un análisis reciente utilizando inteligencia artificial ha revelado patrones únicos en el diseño web japonés, desafiando la percepción común de minimalismo asociada a la cultura japonesa. La investigación, basada en el análisis de 2.671 imágenes de sitios web populares de todo el mundo, identificó q
Prql: Nuevo lenguaje facilita la ingeniería de datos
Un nuevo lenguaje de consulta de código abierto llamado PRQL ha sido presentado con el objetivo de simplificar la ingeniería de datos y el análisis. Desarrollado por un equipo independiente, PRQL busca ofrecer una alternativa más legible y eficiente a SQL, abordando la complejidad inherente a este l
DataStudio: análisis de datos local y sin nube
Un nuevo software de análisis y visualización de datos llamado DataStudio ha sido lanzado, permitiendo a los usuarios explorar y manipular datos directamente en sus navegadores web. Desarrollado por Dataspren Analytics y disponible en GitHub, DataStudio se distingue por su enfoque en la privacidad y
VennFan: Diagramas de Datos Más Claros y Flexibles
El artículo presenta VennFan, una nueva técnica para generar diagramas de Venn, una herramienta visual fundamental para representar relaciones entre conjuntos de datos. Los diagramas de Venn tradicionales, aunque útiles, a menudo sufren de problemas de legibilidad y flexibilidad, especialmente al tr
Claude Code: Email Marketing impulsado por IA
El Email Marketing Bible y su integración con Claude Code representan un avance significativo en la forma en que abordamos el email marketing. En esencia, se trata de una base de conocimiento exhaustiva, compilada a partir de 908 fuentes diversas, incluyendo informes de la industria (Litmus, Klaviyo
Cintura femenina: cómo ha cambiado en décadas
Un análisis reciente de The Pudding, basado en datos del Centro Nacional de Estadísticas de Salud (NCHS) de EE.UU., revela cambios en las proporciones corporales de las mujeres adultas a lo largo de las décadas. El estudio, que utiliza datos recopilados entre 2021 y 2023 y los compara con mediciones
Golf: Nuevo modelo visualiza estrategias y mejora el juego
Este artículo describe un proyecto innovador para visualizar la estrategia en el diseño de campos de golf, expandiendo la metodología de 'strokes gained' (SG) popularizada por Mark Broadie. Broadie revolucionó el análisis del golf al enfocarse en la comparación de golpes basados en la distancia, per
Ofertas de empleo: ¿cuánto tiempo permanecen activas?
Un análisis reciente de Corvi.careers, basado en un muestreo de 475.840 ofertas de empleo activas recopiladas en los últimos 180 días, revela que las ofertas de trabajo suelen permanecer abiertas durante aproximadamente 3 a 4 semanas. La duración mediana es de 20 a 30 días, aunque alrededor de una c
Palantir demanda a revista suiza por artículos críticos
La empresa de análisis de datos estadounidense Palantir Technologies ha demandado a la revista suiza en línea "Republik" para obtener una rectificación judicial tras la publicación de dos artículos que detallan los esfuerzos de Palantir por establecer relaciones comerciales con autoridades suizas. L
Estadística fácil: Aprende con visualizaciones interactivas
Seeing Theory es un proyecto web innovador cuyo objetivo principal es democratizar el aprendizaje de la estadística a través de visualizaciones interactivas. En un mundo donde los datos son omnipresentes, comprender los conceptos estadísticos subyacentes es crucial para tomar decisiones informadas,
Informe Backblaze: Fallos de discos duros bajan en 2025
Backblaze ha publicado su informe anual de estadísticas de discos duros de 2025, revelando una tasa de fallos anual del 1.36%, una mejora con respecto al 1.55% de 2024. El informe, basado en el análisis de 349,462 discos duros, destaca tendencias y patrones observados a lo largo de 13 años de recopi
