¿Idiomas similares a DAX? ¿Alguna biblioteca basada en Python?

Un usuario Pregunto ✅

vyacheslavg

Hola colegas,

¿Podría indicar si es posible replicar algunas de las funciones de DAX en algunas bibliotecas de Python?

Por ejemplo, la mayoría de las funciones M (¿todas?) se pueden realizar en Python (+Pandas, Numpy, otros módulos).

Pero DAX es tan diferente que no conozco ningún lenguaje de programación general que pueda replicarlo.

SQL no es muy bueno para el análisis de datos (estrictamente en mi humilde opinión), su kilometraje puede variar.

El script Qlik está bien, pero su uso está limitado a los productos Qlik.

No pude encontrar nada similar a DAX en el ecosistema Python o R.

Según entiendo, un panorama de análisis muy rápido (Memsql, Mapd, …) usan almacenes de columnas para datos históricos (enfoque, idéntico a Power BI y Qlik). Estos RDBMS usan SQL para cargas de trabajo de análisis, sin inventar su propio lenguaje de análisis de datos, como Microsoft o Qlik. ¿Es este el único enfoque o existe un lenguaje de análisis de datos de código abierto en algún lugar?

TLDR: ¿existen análogos de DAX o Qlik script para cargas de trabajo analíticas para datos almacenados en columnas? Preferiblemente algo basado en Python.

greg_deckler

No estoy lo suficientemente familiarizado con Python y R para saberlo. MDX, pero eso no es Python o R.

Supongo que la pregunta es ¿por qué exactamente? Puede usar Python y R desde Power BI para tener acceso a M, DAX, R y Python, todo en una plataforma.

Hay una razón por la que existen diferentes idiomas. Puede hacer lo que quiera en un lenguaje de propósito general como C#, etc., pero cuando se trata de procesar listas, Lisp seguro que es bueno. Por otra parte, no desea usar Ruby si está tratando de interactuar con los sistemas de control, C es probablemente una mejor opción. Hay un amplio mundo de lenguajes de programación fuera de la burbuja de Python.

vyacheslavg

En respuesta a greg_deckler

Gracias.

Mi pregunta no se limita a Python, incluso si tengo una preferencia de Python, porque Python es excelente en mi opinión, no estoy limitado a eso.

Decir que Python está «integrado» en Power BI es una gran exageración. Python es una parte muy pequeña (opcional) de ETL en Power BI y, por lo tanto, su función es muy limitada. No puede usar Python para tener acceso a DAX o incluso realizar ninguna acción en el modelo de datos de columnas en general, al menos no he encontrado ninguna información sobre cómo hacerlo. Además, la «integración» de Python con M es muy lenta. Es por eso que el uso de memoria ultrarrápida y tecnologías SSD Python, como Parquet o Arrow, es inútil dentro del proceso ETL de Power BI.

Pregunta – por qué – es una muy buena pregunta Guiño de robot. Estoy buscando otros enfoques inteligentes para manejar el análisis de datos, preferiblemente de código abierto y vinculados con lenguajes de propósito general.

Como escribí, Python+Pandas+Numpy es muy similar a M, funcionalmente sabio. No puedo pensar en ninguna tarea ETL realista que no pueda realizar con él.

¿Por qué otras bases de datos en columnas RDBMS no crean sus «propios» lenguajes de análisis de datos y usan SQL, que es mucho mejor para las bases de datos operativas, no para las analíticas? Es bueno que existan lenguajes analíticos tan especializados, como DAX o Qlik script, pero tal vez haya alternativas.

greg_deckler

En respuesta a vyacheslavg

En realidad, puede usar Python para acceder a los datos como DAX. Utilice la visualización Py que está integrada directamente en Desktop. En el área de VISUALIZACIONES es el icono amarillo «Py». Justo al lado del ícono «R».

Todavía no lo estoy entendiendo. Entonces, ¿Python debería tener su propia versión de SQL que haga lo mismo que SQL en comparación con solo usar SQL? Estoy confundido.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *