A Databricks anunciou hoje que adquiriu a Okera, uma plataforma de governança de dados com foco em IA. As duas empresas não divulgaram o preço de compra. De acordo com a Crunchbase, Okera levantou anteriormente pouco menos de US$ 30 milhões. Os investidores incluem Felicis, Bessemer Venture Partners, Cyber ​​Mentor Fund, ClearSky e Emergent Ventures.

A governança de dados já era um tópico importante, mas o foco recente na IA destacou algumas das deficiências da abordagem anterior, observa a Databricks no anúncio de hoje. “Historicamente, as tecnologias de governança de dados, independentemente da sofisticação, dependem da imposição de controle em alguma camada de cintura estreita e exigem que as cargas de trabalho se encaixem no ‘jardim murado’ nessa camada’, explica a empresa em uma postagem no blog. Essa abordagem não funciona mais na era dos grandes modelos de linguagem (LLMs) porque o número de ativos está crescendo muito rapidamente (em parte porque grande parte dele é gerado por máquina) e porque o cenário geral da IA ​​está mudando muito rapidamente, os controles de acesso padrão não são capazes de capturar essas alterações com rapidez suficiente.

Databricks adquire plataforma de governança de dados centrada em IA Okera

Okera então usa um sistema alimentado por IA que pode descobrir e classificar automaticamente informações de identificação pessoal, marcá-las e aplicar regras a elas (com foco nos metadados), usando uma interface sem código.

Como enfatizou a equipe do Databricks, esse é um dos motivos pelos quais a empresa estava interessada em adquirir a Okera, mas o outro é a tecnologia de isolamento do serviço, que pode impor o controle de governança em cargas de trabalho arbitrárias sem grandes despesas gerais. Essa tecnologia ainda está em pré-visualização privada, mas provavelmente foi uma das principais razões pelas quais a Databricks adquiriu a empresa.

A Databricks, que lançou seu próprio LLM há algumas semanas, planeja integrar a tecnologia da Okera em seu Catálogo Unity, sua solução de governança existente de dados e ativos de IA. A empresa também observou que a aquisição permitirá que a Databricks exponha APIs adicionais que seus próprios parceiros de governança de dados poderão usar para fornecer soluções a seus clientes.

Com esta aquisição, a Databricks também está trazendo o cofundador e CEO da Okera, Nong Li. Li criou o formato de armazenamento de dados Apache Parquet e foi engenheiro na Databricks por um breve período entre trabalhar na Cloudera e antes de iniciar a Okera, onde foi o CTO fundador e se tornou o CEO em fevereiro de 2022.

“À medida que os dados continuam a crescer em volume, velocidade e variedade em diferentes aplicativos, CIOs, CDOs e CEOs em geral precisam equilibrar essas duas iniciativas frequentemente conflitantes – sem mencionar que, historicamente, gerenciar políticas de acesso em várias nuvens tem sido doloroso e demorado”, escreve Li no anúncio de hoje. “Muitas organizações não têm talento técnico suficiente para gerenciar políticas de acesso em escala, especialmente com a explosão de LLMs. O que eles precisam é de uma solução de governança moderna centrada em IA. Não poderíamos estar mais entusiasmados em nos juntar à equipe Databricks e trazer nossa experiência na construção de soluções de governança seguras, escaláveis ​​e simples para algumas das empresas mais inovadoras do mundo”… leia mais em Teg6 03/05/2023