Quando você pensa em modelos de fundação e no que eles podem realizar, é provável que esteja pensando em criação de texto e imagem. A Numbers Station, no entanto, está levando esses modelos em uma direção muito diferente. A startup, que está anunciando uma rodada da Série A de $ 17,5 milhões hoje, está usando esses modelos para construir o que a empresa chama de “plataforma inteligente de automação de pilha de dados”. A rodada de financiamento foi liderada por Madrona, com a participação da Norwest Venture Partners, Factory e vários investidores anjos, incluindo o cofundador da Cloudera, Jeff Hammerbacher.

Fundada pelos PhDs da Standford Chris Aberger (CEO), Ines Chami (cientista chefe) e Sen Wu, juntamente com o professor associado de Stanford Chris Ré, a Numbers Station visa trazer o poder dos modelos de fundação no estilo GPT para casos de uso corporativo, começando com a transformação de dados e correspondência de registros. Para fazer isso, a empresa usa esses modelos de base para, por exemplo, traduzir consultas de linguagem natural em comandos SQL.

“Todos nós temos doutorado em uma mistura de IA e sistemas de dados”, Aberger me disse quando perguntei a ele sobre as origens da empresa. “Vimos na época que a maioria dos talentos de IA estava realmente focando – por falta de uma palavra melhor – os aplicativos de IA mais atraentes. Todas as coisas que você vê nas notícias: geração de conteúdo de marketing, geração de imagem, seja lá o que for. […] Mas a maior parte do talento da IA ​​não estava focada nessas operações de encanamento de dados sujos, manipulação de dados, disputa de dados e preparação de dados. Não é tão atraente quanto gerar uma imagem para dizer que vamos reformatar as datas em seu banco de dados, mas ainda é um grande problema e uma necessidade da empresa.”

Numbers Station arrecada US$ 17 5 milhões

Aberger também observou que, quando a equipe observou como diferentes equipes centradas em dados dentro de muitas empresas trabalham juntas, muitos recursos diferentes foram bloqueados em equipes diferentes, enquanto essas equipes gastam muito tempo no trabalho rotineiro de transformação de dados que é necessário para habilitar casos de uso mais complexos. Ele acredita que o Numbers Station – e os modelos de fundação que o alimentam – serão capazes de democratizar o acesso a esses recursos.

“Em alto nível, nossa missão é acelerar essas equipes e acelerar as equipes de analistas de dados, para que possam passar mais tempo fornecendo informações e menos tempo nessas operações mundanas de dados”, explicou Aberger.

Na prática, isso significa que o serviço oferece atualmente três recursos distintos. A primeira é a transformação SQL, que permite aos usuários especificar o que precisam em linguagem natural, com o Numbers Station gerando a consulta SQL. A outra é o que a empresa chama de “transformação de IA”, ou seja, a capacidade de prototipar transformações de dados inteligentes alimentadas por IA. E, por último, o Numbers Station também oferece um recurso de correspondência de registros que permite aos usuários, por exemplo, combinar os registros em seu CRM e sistemas de vendas em um único banco de dados.

Como me disse a cofundadora e cientista-chefe da Numbers Station, Ines Chami, a equipe não está simplesmente pegando um modelo básico e aplicando-o a todos esses casos de uso. “É muito importante personalizar e adaptar o modelo especificamente para a organização”, disse ela. “A ideia é gerar respostas específicas para a organização, por isso utilizamos técnicas de fine tuning e também feedback.” Ela observou que a empresa inicia os usuários em um modelo pré-treinado de uso geral, mas, à medida que os usuários fornecem feedback ao modelo, ele gera modelos menores e específicos da organização para esses usuários. “É muito human-in-the-loop para se adaptar [the model] ao conhecimento organizacional. Então, em todas as frentes, percebemos que é muito importante ir além do modelo de uso geral. Isso é ótimo para começar, mas muito rapidamente, você precisa ajustar e especializar os modelos”, explicou ela e também observou que a empresa sempre mantém os dados de cada cliente isolados.

Aberger também enfatizou que, em sua opinião, os modelos de fundação como OpenAI se tornarão comoditizados. “O que realmente importa é onde você aplica o conhecimento de IA sobre esses modelos para fazê-los funcionar muito bem para organizações específicas e tarefas de uma organização específica”, disse ele.

E não se engane, o Numbers Station está olhando para esses três primeiros recursos como seu ponto de entrada na pilha de dados corporativos. A visão mais ampla aqui é construir uma plataforma de inteligência de dados que não apenas ajude as empresas a transformar seus dados, mas também a analisá-los. Mas, para fazer isso, primeiro precisa ajudar as empresas a limpar seus registros.

“Acreditamos nos modelos de fundação, especificamente como o Números Estação equipe está aplicando-os, fornecem uma oportunidade verdadeiramente ‘zero para um’ para enfrentar o enorme desafio de lidar com dados confusos”, disse o diretor administrativo da Madrona, Tim Porter, que se juntará ao Números Estação quadro. “Ainda mais emocionante, a preparação de dados é apenas o primeiro passo na visão ambiciosa da equipe. Por exemplo, conectar imediatamente essas transformações inteligentes em fluxos de trabalho automatizados é outra vantagem importante do Números Estação abordagem. Estamos entusiasmados em apoiar esta equipe de classe mundial voltada para o cliente enquanto eles constroem a plataforma que acreditamos que todas as empresas verão como um elemento crucial em sua pilha de dados moderna”… leia mais em Teg6 20/03/2023