Importando arquivo HRML

1 resposta
java
J

Galera, eu estava fazendo manualmente o preenchimento de dados num sistema, porém, descobri que as informações que uso estão disponíveis em um site, num documento HTML. Pois bem, descobri com ajuda de alguns tópicos que posso ler e importar esses dados pelo java. Implementei algo que deu certo, porém, o arquivo tem informações que não preciso. Lá tem 21 uma colunas, a maioria com informações que não servem pra nada. Eu gostaria de pegar apenas os dados das colunas de 1 a 8, 11, 12 e 13. São as únicas que preciso. Alguem saberia como posso fazer isso ?

Aqui está o código que consegui fazer ate agora:

public class LerArquivo {

public static void main (String[]args){
  try{
     BufferedReader br = new BufferedReader(new FileReader("C:/Users/maste/Desktop/MegaSena/D_MEGA.HTM"));
     while(br.ready()){
        boolean isTag = true;
    String linha = br.readLine();
 String linhaImp = "";
    for(int cont = 0; cont < linha.length(); cont++){  
        char letra = linha.charAt(cont);  
        if(letra == '<'){
        	isTag = true;
        } else if(!isTag){
        	linhaImp += letra;
        } 
        if(letra == '>'){
        	isTag = false;
        }  	   
    }
    System.out.println(linhaImp);
     }
     br.close();
  }catch(IOException ioe){
     ioe.printStackTrace();
  }

}
}

1 Resposta

Rodrigo_Void

Olá,
precisará trabalhar com o html como um xml, usando Document. Assim conseguirá pegar somente as tags que quiser.
Ou usar REGEX.
Só não manipule a String html como estás fazendo.

Criado 26 de fevereiro de 2017
Ultima resposta 6 de mar. de 2017
Respostas 1
Participantes 2