Robôs humanóides poderiam poder correr, dançae ocasionalmente chutar pessoasmas para se tornar Realmente humanos, eles terão que aprender a realizar todos os tipos de tarefas servis no trabalho.
Flexion Robotics, uma startup suíça fundada por ex-alunosNvidia pesquisadores de robótica, acham que têm a solução. A empresa desenvolveu uma forma de treinar robôs para realizar tarefas complexas que envolvem habilidades simples como abrir portas, subir escadas e carregar caixas. A chave é ensinar aos robôs habilidades individuais de simulação e, em seguida, fazer com que um algoritmo mestre de IA determine como usá-los.
A maioria dos vídeos de demonstração mostra humanóides treinados para realizar uma tarefa específica, como dobrar camisas ou carregar prateleiras. Isso geralmente é feito por teleoperação, ou seja, alguém nos bastidores controla os movimentos do robô. Mas esta abordagem não funciona de forma confiável quando o robô é colocado em parâmetros desconhecidos. A Flexion afirma que seu sistema é diferente – e mais eficiente – porque treina seus robôs em simulação e com instrução humana limitada.
O vídeo abaixo mostra o software em ação: Um robô humanóide Unitree modificado opera de forma autônoma após receber o seguinte comando: “Um pacote contendo lanches foi entregue na Flexion. Recolha-o pelas escadas e suba no elevador. Em seguida, desempacote e coloque os itens na gaveta vazia da prateleira da área de lanches.”
Cortesia de Flexão
A abordagem do Flexion funciona combinando diferentes sistemas de IA.
O principal modelo de IA determina como realizar suas tarefas digerindo vídeos de humanos fazendo coisas diferentes. O software então combina as habilidades aprendidas na simulação com os vídeos e executa essas tarefas no mundo real. Para acessar a sala de correspondência de um escritório, por exemplo, a modelo pode ter aprendido que deve abrir determinadas portas e usar o elevador. O sistema também controla os motores do robô, permitindo-lhe andar, movimentar os membros e manter o equilíbrio.
De acordo com Nikita Rudin, cofundadora e CEO da Flexion e ex-pesquisadora de robótica da Nvidia, o “ingrediente secreto” do software é o uso extensivo de aprendizagem por reforço, que treina computadores para dominar tarefas por meio de tentativa e erro. Cada camada do software, desde o modelo mestre de IA até a simulação e o controle do motor, usa essa abordagem.
Cortesia de Flexão



