La plataforma de datos para la era de la IA: Microsoft Fabric

Por Arun Ulagaratchagan, Corporate Vice President, Azure Data.

337

El mundo de hoy está inundado de transmisión de datos desde los dispositivos que utilizamos, las aplicaciones que construimos y las interacciones que tenemos. Las organizaciones de todos los sectores han aprovechado estos datos para transformar digitalmente y obtener ventajas competitivas. Y ahora, al entrar en una nueva era definida por la IA, estos datos se están volviendo aún más importantes.

La IA generativa y los grandes servicios de modelos de idiomas, como Azure OpenAI Service, permiten a los clientes utilizar y crear experiencias cotidianas de IA que reinventan la forma en que los empleados invierten su tiempo. Potenciar las experiencias de IA específicas de la organización requiere un suministro constante de datos limpios desde un sistema de análisis bien administrado y altamente integrado. Pero los sistemas de análisis de la mayoría de las organizaciones son un laberinto de servicios especializados y desconectados.

Y no es de extrañar dado el mercado de datos y tecnología de IA enormemente fragmentado con cientos de proveedores y miles de servicios. Los clientes deben unir un conjunto complejo de servicios desconectados de múltiples proveedores y pagar un fuerte «impuesto de integración» tanto en dinero como en esfuerzo para que estos servicios funcionen juntos.

Microsoft Fabric

Hoy presentamos Microsoft Fabric, una plataforma de análisis unificada e integral que reúne todas las herramientas de datos y análisis que las organizaciones necesitan. Fabric integra tecnologías como Data Factory, Synapse y Power BI en un único producto unificado, lo que permite a los profesionales de los datos y los negocios desbloquear el potencial de sus datos y sentar las bases para la era de la IA.

Microsoft Fabric es un producto de análisis integral que aborda todos los aspectos de las necesidades de análisis de una organización. Pero hay cinco áreas que realmente distinguen a Fabric del resto del mercado.

1. Fabric es una plataforma de análisis completa

Cada proyecto de análisis tiene varios subsistemas. Cada subsistema necesita una gama diferente de capacidades, que a menudo requieren productos de múltiples proveedores. La integración de estos productos puede ser un esfuerzo complejo, frágil y caro.

Con Microsoft Fabric, los clientes pueden usar un solo producto con una experiencia y arquitectura unificadas que proporciona todas las capacidades necesarias para que un desarrollador extraiga información de los datos y la presente al usuario empresarial. Y al ofrecer la experiencia como Software as a Service (SaaS), todo es ¿Quieres aprender y hacer preguntas a las personas que crearon Microsoft Fabric? Únase a nosotros el 24 de mayo a las 9 AM PST para un evento en vivo de dos días para ver Microsoft Fabric en acción. Estas sesiones estarán disponibles ondemand después del 25 de mayo . Únase al evento en vivo o vea la lista completa de sesiones integradas y optimizadas automáticamente, y los usuarios pueden registrarse en segundos y obtener valor comercial real en minutos.

Microsoft Fabric capacita a cada equipo en el proceso de análisis con las experiencias específicas que necesitan, por lo que los ingenieros de datos, los profesionales de almacenamiento de datos, los científicos de datos, los analistas de datos y los usuarios empresariales se sienten como en casa.

Fabric tiene 7 cargas de trabajo principales:

  • Data Factory proporciona más de 150 conectores a fuentes de datos en la nube y en el entorno, experiencias de arrastrar y soltar para la transformación de datos y la capacidad de orquestar los flujos de datos. Actualmente en vista previa pública.
  • Synapse Data Engineering permite excelentes experiencias de creación para Spark, inicio instantáneo con livepools y la capacidad de colaborar. Actualmente en vista previa pública.
  • Synapse Data Science proporciona un flujo de trabajo de extremo a extremo para que los científicos de datos construyan modelos sofisticados de IA, colaboren fácilmente y entrenen, implementen y administren modelos de aprendizaje automático. Actualmente en vista previa pública.
  • Synapse Data Warehousing proporciona una experiencia de almacenamiento de datos y casa de lago convergente con un rendimiento SQL líder en la industria en formatos de datos abiertos. Actualmente en vista previa pública.
  • Synapse Real-Time Analytics permite a los desarrolladores trabajar con la transmisión de datos desde dispositivos IoT, telemetría, registros, etc. y analizar volúmenes masivos de datos semiestructurados con alto rendimiento y baja latencia. Actualmente en vista previa pública.
  • Power BI en Microsoft Fabric proporciona visualización líder en la industria y análisis basados en IA que permiten a los analistas de negocios y usuarios empresariales obtener información de los datos. La experiencia de Power BI también está profundamente integrada en Microsoft 365, proporcionando información relevante donde los usuarios de negocios ya trabajan.
  • Data Activator proporciona detección y monitoreo de datos en tiempo real y puede desencadenar notificaciones y acciones cuando encuentra patrones especificados en los datos, todo en una experiencia sin código. Actualmente en vista previa privada.

2. Fabric es lacustre y abierto

Los lagos de datos actuales pueden ser desordenados y complicados, lo que dificulta a los clientes crear, integrar, gestionar y operar lagos de datos. Y una vez que están operativos, múltiples productos de datos que utilizan diferentes formatos de datos patentados en el mismo lago de datos pueden causar una duplicación de datos significativa y preocupaciones sobre el bloqueo de proveedores.

OneLake – El OneDrive para datos

Microsoft Fabric viene con un lago de datos SaaS, multi-nube llamado OneLake que está incorporado y está disponible automáticamente para cada inquilino de Fabric. Todas las cargas de trabajo de Fabric se conectan automáticamente a OneLake, al igual que todas las aplicaciones de Microsoft 365 se conectan a OneDrive. Los datos se organizan en un centro de datos intuitivo y se indexan automáticamente para su descubrimiento, uso compartido, gobernanza y cumplimiento.

OneLake sirve a desarrolladores, analistas de negocios y usuarios de negocios por igual, ayudando a eliminar los silos de datos omnipresentes y caóticos creados por diferentes desarrolladores que aprovisionan y configuran sus propias cuentas de almacenamiento aisladas. En su lugar, OneLake proporciona un único sistema de almacenamiento unificado para todos los desarrolladores, donde el descubrimiento y el intercambio de datos es fácil con la política y la configuración de seguridad se aplican de forma centralizada. En la capa de API, OneLake está construido y es totalmente compatible con Azure Data Lake Storage Gen2 (ADLSg2), aprovechando al instante el vasto ecosistema de aplicaciones, herramientas y desarrolladores de ADLSg2.

Una capacidad clave de OneLake es «Atajos.» OneLake permite compartir fácilmente datos entre usuarios y aplicaciones sin tener que mover y duplicar información innecesariamente. Los accesos directos permiten a OneLake virtualizar el almacenamiento del lago de datos en ADLS Gen2, AWS S3 y Google Storage (próximamente), lo que permite a los desarrolladores componer y analizar datos en las nubes.

Formatos de datos abiertos en todas las ofertas de análisis

Microsoft Fabric está profundamente comprometido con los formatos de datos abiertos en todas sus cargas de trabajo y niveles. Fabric trata a Delta en los archivos de Parquet como un formato de datos nativo que es el predeterminado para todas las cargas de trabajo. Este profundo compromiso con un formato de datos abierto común significa que los clientes necesitan cargar los datos en el lago solo una vez y todas las cargas de trabajo pueden operar con los mismos datos, sin tener que ingerirlos por separado. También significa que OneLake soporta datos estructurados de cualquier formato y datos no estructurados, dando a los clientes total flexibilidad.

Al adoptar OneLake como nuestra tienda y delta/parquet como el formato común para todas las cargas de trabajo, ofrecemos a los clientes una pila de datos unificada al nivel más fundamental. Los clientes no necesitan mantener diferentes copias de datos para bases de datos, lagos de datos, almacenamiento de datos, inteligencia de negocios o análisis en tiempo real. En su lugar, una sola copia de los datos en OneLake puede alimentar directamente todas las cargas de trabajo.

La gestión de la seguridad de los datos (niveles de tabla, columna y fila) en diferentes motores de datos puede ser una pesadilla persistente para los clientes. Fabric proporcionará un modelo de seguridad universal que se gestiona en OneLake, y todos los motores lo hacen cumplir de manera uniforme a medida que procesan consultas y trabajos. Este modelo llegará pronto.

3. Fabric es impulsado por IA

Estamos infundiendo Microsoft Fabric con Azure OpenAI Service en cada capa para ayudar a los clientes a liberar todo el potencial de sus datos, permitiendo a los desarrolladores aprovechar el poder de la IA generativa contra sus datos y ayudando a los usuarios empresariales a encontrar información valiosa en sus datos. Con Copilot en Microsoft Fabric en cada experiencia de datos, los usuarios pueden usar el lenguaje conversacional para crear flujos de datos y tuberías de datos, generar código y funciones completas, construir modelos de aprendizaje automático o visualizar resultados. Los clientes pueden incluso crear sus propias experiencias de lenguaje conversacional que combinan los modelos de Azure Open AI Service y sus datos y publicarlos como complementos.

Copilot en Fabric se basa en nuestros compromisos existentes con la seguridad de los datos y la privacidad en la empresa. Copilot hereda automáticamente las políticas de seguridad, cumplimiento y privacidad de una organización. Los modelos de idiomas grandes de copiloto no están entrenados en los datos de inquilinos de una organización.

Copiloto en Microsoft Fabric llegará pronto. Manténgase atento al blog de Microsoft Fabric para las últimas actualizaciones y la fecha de lanzamiento pública de Copilot en Microsoft Fabric.

4. Fabric empodera a cada usuario empresarial

Los clientes aspiran a impulsar una cultura de datos en la que todos en su organización tomen mejores decisiones basadas en datos. Para ayudar a nuestros clientes a fomentar esta cultura, Microsoft Fabric se integra profundamente con las aplicaciones de Microsoft 365 que la gente utiliza todos los días.

Con decenas de millones de usuarios, Power BI proporciona un tejido conectivo de alto ancho de banda entre OneLake y Microsoft 365. Los datos relevantes de OneLake son fácilmente detectables y accesibles para los usuarios desde Microsoft 365, lo que ayuda a los clientes a obtener más valor de sus datos.

Por ejemplo, los usuarios de Microsoft Excel pueden descubrir y analizar datos directamente en OneLake y generar un informe de Power BI con un clic de un botón. En Microsoft Teams, los usuarios pueden infundir datos en su trabajo diario con canales integrados, chat y experiencias de reuniones. Los usuarios de negocios pueden llevar datos a sus presentaciones mediante la incorporación de informes Power BI en vivo directamente en Microsoft PowerPoint. Power BI también se integra de forma nativa con SharePoint, lo que permite compartir y difundir fácilmente los conocimientos. Y con Microsoft Graph Data Connect, los datos de Microsoft 365 se integran de forma nativa en OneLake para que los clientes puedan descubrir información sobre sus relaciones con los clientes, los procesos de negocio, la seguridad y el cumplimiento y la productividad de las personas.

5. Fabric reduce costes gracias a las capacidades unificadas

Los sistemas de análisis actuales suelen combinar productos de múltiples proveedores en un solo proyecto. Esto se traduce en capacidad de computación aprovisionada en múltiples sistemas como integración de datos, ingeniería de datos, almacenamiento de datos e inteligencia de negocios. Cuando uno de los sistemas está inactivo, su capacidad no puede ser utilizada por otro sistema causando un desperdicio significativo.

La compra y gestión de recursos se simplifica enormemente con Microsoft Fabric. Los clientes pueden comprar un solo grupo de computación que impulsa todas las cargas de trabajo de Fabric. Con este enfoque todo incluido, los clientes pueden crear soluciones que aprovechan todas las cargas de trabajo libremente sin ningún tipo de fricción en su experiencia o comercio. Las capacidades de cálculo universal reducen significativamente los costos, ya que cualquier capacidad de cálculo no utilizada en una carga de trabajo puede ser utilizada por cualquiera de las cargas de trabajo.

Autor