Plataformas
Adote
Experimente
-
24. Databricks Unity Catalog
¨¦ uma solu??o de governan?a de dados para ativos como arquivos, tabelas ou modelos de aprendizado de m¨¢quina em um . ? uma vers?o gerenciada do de c¨®digo aberto que pode ser usada para governar e consultar dados mantidos em armazenamentos externos ou sob gerenciamento do Databricks. No passado, nossas equipes trabalharam com uma variedade de solu??es de gerenciamento de dados, como ou . No entanto, o suporte combinado do Unity Catalog para governan?a, gerenciamento de metastore e descoberta de dados o torna atraente porque reduz a necessidade de gerenciar m¨²ltiplas ferramentas. Uma complica??o que nossa equipe descobriu ¨¦ a falta de recupera??o autom¨¢tica de desastres no Unity Catalog gerenciado pelo Databricks. Conseguiram configurar sua pr¨®pria funcionalidade de backup e restaura??o, mas uma solu??o fornecida pelo Databricks teria sido mais conveniente. Observe que, embora essas plataformas de governan?a geralmente implementam uma solu??o centralizada para garantir consist¨ºncia entre espa?os e cargas de trabalho, a responsabilidade de governar ainda pode ser federada, permitindo que equipes individuais governem seus pr¨®prios ativos.
-
25. FastChat
¨¦ uma plataforma aberta para treinamento, disponibiliza??o e avalia??o de grandes modelos de linguagem (LLMs). Nossas equipes usam seus recursos de fornecimento de modelos para hospedar v¨¢rios modelos ¡ª , e ¡ª para diferentes finalidades, tudo em um formato consistente de API OpenAI. O FastChat opera em uma arquitetura de controlador-agente, permitindo que v¨¢rios agentes hospedem modelos diferentes. Ele oferece suporte a tipos de agentes, como vLLM, LiteLLM e MLX. Usamos por seus recursos de alta taxa de transfer¨ºncia. Dependendo do caso de uso (lat¨ºncia ou taxa de transfer¨ºncia), diferentes tipos de agentes modelo do FastChat podem ser criados e dimensionados. Por exemplo, o modelo usado para sugest?es de c¨®digo em IDEs de desenvolvedoras exige baixa lat¨ºncia e pode ser dimensionado com v¨¢rios agentes FastChat para lidar com solicita??es simult?neas de forma eficiente. Por outro lado, o modelo usado para Text-to-SQL n?o precisa de v¨¢rios agentes devido ¨¤ menor demanda ou a diferentes requisitos de desempenho. Nossas equipes aproveitam os recursos de dimensionamento do FastChat para testes A/B. Configuramos os agentes do FastChat com o mesmo modelo, mas com valores de hiperpar?metro diferentes, e fazemos perguntas id¨ºnticas a cada um deles, identificando os valores ideais de hiperpar?metro. Ao fazer a transi??o de modelos em tempo real, realizamos testes A/B para garantir uma migra??o perfeita. Por exemplo, recentemente migramos do para o para sugest?es de c¨®digo. Executando os dois modelos simultaneamente e comparando os resultados, verificamos que o novo modelo atendia ou excedia o desempenho do modelo anterior sem interromper a experi¨ºncia da pessoa desenvolvedora.
-
26. GCP Vertex AI Agent Builder
oferece uma plataforma flex¨ªvel para a cria??o de agentes de IA utilizando linguagem natural ou uma abordagem baseada primariamente em c¨®digo. A ferramenta se integra de forma transparente com dados empresariais por meio de conectores de terceiros e possui todas as ferramentas necess¨¢rias para construir, prototipar e implantar agentes de IA. ? medida que a demanda por agentes de IA cresce, muitas equipes enfrentam dificuldades em compreender seus benef¨ªcios e sua implementa??o. O GCP Vertex AI Agent Builder facilita para as desenvolvedoras a prototipagem r¨¢pida de agentes e o gerenciamento de tarefas complexas com dados, exigindo apenas um simples setup. Nossas desenvolvedoras consideraram a ferramenta particularmente ¨²til para a constru??o de sistemas baseados em agentes, como bases de conhecimento ou sistemas automatizados de suporte, que gerenciam de forma eficiente tanto dados estruturados quanto n?o estruturados. Isso a torna uma ferramenta valiosa para o desenvolvimento de solu??es impulsionadas por IA.
-
27. Langfuse
LLMs funcionam como caixas pretas, tornando dif¨ªcil determinar seu comportamento. A observabilidade ¨¦ crucial para abrir essa caixa preta e entender como os aplicativos LLM operam em produ??o. Nossas equipes tiveram experi¨ºncias positivas usando para observar, monitorar e avaliar aplicativos baseados em LLM. Suas capacidades de rastreamento, an¨¢lise e avalia??o nos permitem n?o apenas analisar o desempenho e a precis?o da conclus?o, mas tamb¨¦m gerenciar custos e lat¨ºncia. Al¨¦m disso, tamb¨¦m permite entender padr?es de uso da produ??o, facilitando melhorias cont¨ªnuas e orientadas a dados. Os dados de instrumenta??o fornecem rastreabilidade completa do fluxo de solicita??o-resposta e das etapas intermedi¨¢rias, que podem ser usados como dados de teste para validar o aplicativo antes de implementar novas altera??es. Utilizamos o Langfuse com RAG (gera??o aumentada por recupera??o), entre outras arquiteturas LLM, e agentes aut?nomos impulsionados por LLM. Em um aplicativo baseado em RAG, por exemplo, a an¨¢lise de rastreamentos de conversas com baixa pontua??o ajuda a identificar quais partes da arquitetura (pr¨¦-recupera??o, recupera??o ou gera??o) precisam de refinamento. Outra op??o que vale a pena considerar neste espa?o ¨¦ .
-
28. Qdrant
¨¦ um mecanismo de busca por similaridade vetorial e banco de dados de c¨®digo aberto escrito em Rust. Ele suporta uma ampla gama de texto e um multimodal denso de . Nossas equipes t¨ºm usado embeddings de c¨®digo aberto como e para v¨¢rias bases de conhecimento de produtos. Usamos o Qdrant como um armazenamento de vetores corporativo com para organizar vetores embeddings como cole??es separadas, isolando a base de conhecimento de cada produto no armazenamento. As pol¨ªticas de acesso da usu¨¢ria s?o gerenciadas na camada do aplicativo.
-
29. Vespa
¨¦ um mecanismo de busca de c¨®digo aberto e uma plataforma de processamento de big data. ? particularmente recomendado para aplicativos que exigem baixa lat¨ºncia e alto rendimento. Nossos times gostam da capacidade do Vespa de implementar pesquisa h¨ªbrida usando v¨¢rias t¨¦cnicas de recupera??o, filtrar e classificar com efici¨ºncia muitos tipos de metadados, implementar classifica??o em v¨¢rias fases, indexar v¨¢rios vetores (por exemplo, para cada peda?o) por documento sem duplicar todos os metadados em documentos indexados separadamente e recuperar dados de v¨¢rios campos indexados de uma s¨® vez.
Avalie
-
30. Pesquisa de IA do Azure
A , anteriormente conhecida como Pesquisa Cognitiva do Azure, ¨¦ considera um servi?o de busca baseado em nuvem projetado para lidar com dados estruturados e n?o estruturados para aplica??es como bases de conhecimento, particularmente em gera??o aumentada por recupera??o (RAG). Ela suporta v¨¢rios tipos de busca, incluindo busca por palavras-chave, vetorial e h¨ªbrida, que acreditamos que se tornar?o cada vez mais importantes. O servi?o ingere automaticamente formatos comuns de dados n?o estruturados, incluindo PDF, DOC e PPT, simplificando o processo de cria??o de conte¨²do pesquis¨¢vel. Al¨¦m disso, ele se integra com outros servi?os do Azure, como o Azure OpenAI, permitindo que as usu¨¢rias construam aplica??es com o m¨ªnimo de esfor?o de integra??o manual. Com base em nossa experi¨ºncia, a Pesquisa de IA do Azure tem um desempenho confi¨¢vel e ¨¦ bem adequado para projetos hospedados no ambiente Azure. Atrav¨¦s de suas , as usu¨¢rias tamb¨¦m podem definir etapas espec¨ªficas de processamento de dados. No geral, se voc¨º est¨¢ trabalhando dentro do ecossistema Azure e precisa de uma solu??o de busca robusta para uma aplica??o RAG, vale a pena considerar a Pesquisa de IA do Azure.
-
31. Databricks Delta Live Tables
O ¨¦ um framework declarativo projetado para a cria??o de pipelines de processamento de dados confi¨¢veis, sustent¨¢veis e test¨¢veis. Ele permite que as pessoas engenheiras de dados definam as transforma??es de dados usando uma abordagem declarativa e gerencia automaticamente a infraestrutura subjacente e o fluxo de dados. Um dos recursos de destaque do Delta Live Tables ¨¦ a sua robusta capacidade de monitoramento. Ele fornece um DAG (Gr¨¢fico ac¨ªclico dirigido) de todo o seu pipeline de dados, representando visualmente a movimenta??o de dados da fonte para as tabelas finais. Essa visibilidade ¨¦ crucial para pipelines complexos, ajudando engenheiras e cientistas de dados a rastrear a linhagem e as depend¨ºncias dos dados. O Delta Live Tables est¨¢ profundamente integrado ao ecossistema Databricks, o que tamb¨¦m traz alguns desafios para a customiza??o de interfaces. Recomendamos que as equipes avaliem cuidadosamente a compatibilidade das interfaces de entrada e sa¨ªda antes de usar o Delta Live Tables.
-
32. Elastisys Compliant Kubernetes
¨¦ uma distribui??o especializada do Kubernetes projetada para atender a rigorosos requisitos regulat¨®rios e de conformidade, particularmente para organiza??es que operam em ind¨²strias altamente regulamentadas, como sa¨²de, finan?as e governo. Ele possui processos de seguran?a automatizados, fornece suporte para m¨²ltiplas nuvens e ambientes locais, e ¨¦ constru¨ªdo sobre uma arquitetura de seguran?a de confian?a zero. A ¨ºnfase na conformidade integrada com leis como GDPR e HIPAA e controles como ISO27001 o torna uma op??o atraente para empresas que precisam de um ambiente Kubernetes seguro, compat¨ªvel e confi¨¢vel.
-
33. FoundationDB
¨¦ um banco de dados multi-modelo, adquirido pela Apple em 2015 e disponibilizado como c¨®digo aberto em abril de 2018. O n¨²cleo do FoundationDB ¨¦ um armazenamento chave-valor distribu¨ªdo, que oferece transa??es com serializa??o rigorosa. Desde que o mencionamos pela primeira vez no Radar, ele passou por melhorias significativas, incluindo distribui??es inteligentes de dados para evitar escrita em pontos cr¨ªticos, um novo mecanismo de armazenamento, otimiza??es de desempenho e suporte ¨¤ . Estamos utilizando o FoundationDB em um de nossos projetos em andamento e estamos muito impressionadas pela sua . Essa arquitetura nos permite escalar diferentes partes do cluster de forma independente. Por exemplo, podemos ajustar o n¨²mero de logs de transa??o, servidores de armazenamento e proxies com base em nossa carga de trabalho e hardware espec¨ªficos. Apesar de seus recursos extensivos, o FoundationDB continua sendo extremamente f¨¢cil de executar e operar em grandes clusters.
-
34. Golem
A computa??o dur¨¢vel, um movimento recente na computa??o distribu¨ªda, utiliza um estilo de arquitetura de m¨¢quina de estado expl¨ªcito para persistir a mem¨®ria de servidores serverless para uma melhor toler?ncia a falhas e a recupera??o. O ¨¦ um dos promotores desse movimento. Esse conceito pode ser aplicado em alguns cen¨¢rios como em sagas de microsservi?os de longa dura??o ou fluxos de trabalho prolongados na orquestra??o de agentes de IA. J¨¢ avaliamos o Temporal em outros volumes do Radar para prop¨®sitos semelhantes, e o Golem ¨¦ outra op??o. Com o Golem, ¨¦ poss¨ªvel escrever componentes em WebAssembly em qualquer linguagem suportada, al¨¦m do Golem ser determin¨ªstico e oferecer tempos de inicializa??o r¨¢pidos. Acreditamos que o Golem ¨¦ uma plataforma empolgante que vale a pena ser avaliada.
-
35. Iggy
, uma plataforma de streaming de mensagens persistentes escrita em Rust, ¨¦ um projeto relativamente novo, mas com recursos impressionantes. Ela j¨¢ oferece suporte a m¨²ltiplos streams, t¨®picos e parti??es, entrega at-most-once, expira??o de mensagens e suporte a TLS sobre os protocolos QUIC, TCP e HTTP. Executando como um ¨²nico servidor, a Iggy atualmente alcan?a alta taxa de transfer¨ºncia para opera??es de leitura e escrita. Com o suporte a clustering e io_uring em desenvolvimento, Iggy pode se tornar uma alternativa potencial ao Kafka.
-
36. Iroh
¨¦ um sistema de armazenamento de arquivos distribu¨ªdos e entrega de conte¨²do relativamente novo que foi projetado como a evolu??o dos sistemas descentralizados existentes como IPFS (InterPlanetary File System). Tanto o Iroh quanto o IPFS podem ser usados para criar redes descentralizadas de armazenamento, compartilhamento e acesso de conte¨²do endere?ado utilizando identificadores de conte¨²do opacos. No entanto, , como n?o ter um tamanho m¨¢ximo de bloco e fornecer um mecanismo de sincroniza??o de dados via sobre documentos. O roadmap do projeto inclui trazer a tecnologia para o browser via WASM, o que levanta algumas possibilidades intrigantes para construir a descentraliza??o em aplicativos web. Se voc¨º n?o quiser hospedar no Iroh, voc¨º pode utilizar seu servi?o de nuvem, . J¨¢ existem v¨¢rios SDKs dispon¨ªveis em uma variedade de idiomas, e um dos objetivos ¨¦ ser mais amig¨¢vel e f¨¢cil de usar que sistemas IPFS alternativos. Embora o Iroh ainda esteja em seus primeiros dias, vale a pena acompanh¨¢-lo, pois ele pode se tornar um player significativo no meio de armazenamento descentralizado.
-
37. Plataformas de modelos de vis?o ampla (LVM)
Os modelos de linguagem de grande porte (LLMs) chamam tanto a nossa aten??o atualmente que tendemos a negligenciar os desenvolvimentos em curso nos modelos de vis?o ampla (LVMs). Esses modelos podem ser usados para segmentar, sintetizar, reconstruir e analisar fluxos de v¨ªdeo e imagens, ¨¤s vezes em combina??o com modelos de difus?o ou redes neurais convolucionais padr?o. Apesar do potencial dos LVMs para revolucionar a forma como trabalhamos com dados visuais, ainda enfrentamos desafios significativos na adapta??o e aplica??o deles em ambientes de produ??o. Os dados de v¨ªdeo, por exemplo, apresentam desafios de engenharia ¨²nicos para coletar dados de treinamento, segmentar e rotular objetos, ajustar modelos e, em seguida, implantar os modelos resultantes e monitor¨¢-los em produ??o. Assim, enquanto os LLMs se prestam a interfaces de chat simples ou APIs de texto simples, uma engenheira de vis?o computacional ou cientista de dados deve gerenciar, versionar, anotar e analisar grandes quantidades de dados de v¨ªdeo em streaming; este trabalho requer uma interface visual. Plataformas LVM s?o uma nova categoria de ferramentas e servi?os ¡ª incluindo , e ¡ª que est?o surgindo para enfrentar esses desafios. Deepstream e Roboflow s?o particularmente interessantes para n¨®s porque combinam um ambiente de desenvolvimento GUI integrado para gerenciar e anotar fluxos de v¨ªdeo com um conjunto de APIs Python, C++ ou REST para invocar os modelos a partir do c¨®digo da aplica??o.
-
38. OpenBCI Galea
H¨¢ um no uso de interfaces c¨¦rebro-computador (ICCs) e em seu potencial de aplica??o em tecnologias assistivas. Tecnologias n?o invasivas, como a eletroencefalografia (EEG) e outros sinais eletrof¨ªsicos, oferecem uma alternativa de menor risco em rela??o a implantes cerebrais para aquelas que est?o se recuperando de les?es. Est?o surgindo plataformas nas quais pesquisadoras e empreendedoras podem criar aplica??es inovadoras sem se preocupar com os desafios de processamento de sinais de baixo n¨ªvel e integra??o. Alguns exemplos dessas plataformas s?o e , que oferecem hardware e software de c¨®digo aberto para o desenvolvimento de aplica??es ICC. O produto mais recente da OpenBCI, o , combina ICC com as capacidades de um headset de realidade virtual (VR). Ele oferece ¨¤s pessoas desenvolvedoras acesso a uma variedade de fluxos de dados fisiol¨®gicos sincronizados no tempo, juntamente com sensores de posicionamento espacial e rastreamento ocular. Essa ampla gama de dados de sensores pode ser usada para controlar uma variedade de dispositivos f¨ªsicos e digitais. O SDK suporta v¨¢rias linguagens de programa??o e disponibiliza os dados dos sensores no Unity ou Unreal. Estamos entusiasmadas em notar essa capacidade oferecida em uma plataforma de c¨®digo aberto, permitindo que pesquisadoras tenham acesso ¨¤s ferramentas e aos dados necess¨¢rios para inovar nesse campo.
-
39. PGLite
¨¦ uma constru??o WASM do banco de dados PostgreSQL. Diferentemente de tentativas anteriores que dependiam de uma m¨¢quina virtual Linux, o PGLite constr¨®i diretamente o PostgreSQL para WASM, permitindo que voc¨º o execute inteiramente no navegador web. Voc¨º pode criar um banco de dados tempor¨¢rio na mem¨®ria ou persisti-lo no disco via indexedDB. Desde a ¨²ltima vez que mencionamos aplica??es local-first no Radar, as ferramentas evolu¨ªram consideravelmente. Com Electric e PGLite, voc¨º agora pode construir aplica??es reativas local-first no PostgreSQL.
-
40. SpinKube
¨¦ um runtime serverless de c¨®digo aberto para WebAssembly no Kubernetes. Embora o Kubernetes ofere?a capacidades robustas de autoescalonamento, o tempo de inicializa??o dos containers ainda pode exigir pr¨¦-provisionamento para cargas m¨¢ximas. Acreditamos que o tempo de inicializa??o em milissegundos do WebAssembly proporciona uma solu??o serverless mais din?mica e flex¨ªvel para workloads sob demanda. Desde nossa discuss?o anterior sobre Spin, o ecossistema do WebAssembly fez avan?os significativos. Estamos empolgadas em destacar o SpinKube como uma plataforma que simplifica o desenvolvimento e a implanta??o de workloads baseados em WebAssembly no Kubernetes.
-
41. Unblocked
oferece a descoberta de ativos e artefatos no ciclo de vida de desenvolvimento de software (SDLC). Ele se integra com ferramentas comuns de gerenciamento de ciclo de vida de aplicativos (ALM) e de colabora??o para ajudar os times a entenderem bases de c¨®digos e recursos relacionados. Ele melhora a compreens?o do c¨®digo ao fornecer contexto imediato e relevante, facilitando a navega??o e o entendimento de sistemas complexos. Os times de engenharia podem acessar com seguran?a e em conformidade as discuss?es, os ativos e os documentos relacionados ao seu trabalho. O Unblocked tamb¨¦m captura e compartilha o conhecimento local que muitas vezes est¨¢ com pessoas mais experientes do time, tornando esses insights valiosos acess¨ªveis a todas, independentemente do n¨ªvel de experi¨ºncia.
Evite
N?o encontrou algo que voc¨º esperava achar?
?
Cada edi??o do Radar inclui blips que refletem nossas experi¨ºncias nos seis meses anteriores. Talvez j¨¢ tenhamos falado sobre o que voc¨º procura em um?Radar anterior. ?s vezes, deixamos coisas de fora simplesmente porque h¨¢ muitas a serem abordadas. Tamb¨¦m pode faltar um t¨®pico espec¨ªfico porque o Radar reflete nossa experi¨ºncia, n?o se baseando em uma an¨¢lise abrangente do mercado.