Ajuda

Pessoal, quero desenvolver uma ferramenta igual ao do video. Sabem me dizer como ele faz para procurar a imagem na tela e caso tenha clicar nela?

Ja vi o NativeHook capturando teclas e movimentos do mouse, ele é usado pra capturar informações mesmo com o jform não estando em foco… Agora capturar uma imagem da tela acho que só com uma linguagem de mais baixo nivel como C# ou C++, que tem bibliotecas mais nativas do windows…
Para pressionar as teclas poderia ser usado um boot com o Robot…