quarta-feira, 24 de junho de 2015

reta final!

Relatório parcial: 01/07
relatorio final: 30/07 (Orientador que deve enviar para o sistema)


Chegando final do período o site vai ficar pronto possibilitando a coleta de dados de forma automática pelo cliente.

Ajustes finais

sexta-feira, 1 de maio de 2015

idéia!

Vou ter que dar uma pausa para estudar para circuitos mas tive uma ideia boa para consertar o problema quando o twitter fica sobrecarregado.

Nao temos como tratar como excecao pq nao é um erro, o scroller continua tentando descer a página mas o que acontece é que não desce mais pois chegou no limite, ja que aparece a mensagem de sobrecarregado.


2 opcoes

1ª opcao - ler a barra final e se aparecer a mensagem X (ex: "twitter sobrecarregadi) em ingles ou port, dependendo do driver, retornar

2ª opcao - a cada leitura colocar os tweets todos em um vetor e se a usuario,msg e a hr do ultimo forem iguais a usuario,msg e hr do anterior -> retorna

PROBLEMA:

O problema é que não temos como retornar desse certo ponto. Tenho que pesquisar se o twitter tem algum tipo de pesquisar por hora, o que tb resolveria o utlimo problema comentado ( da pesquisa até as 17:00)

quinta-feira, 30 de abril de 2015

problemas com hora dia na advanced search do twitter

Quando pesquisamos, por exemplo, tweets com uma determinada hashtag até o dia 24 de abril de 2014, ele nos retorna resultados até do dia 23 de abril de 2014 até 17:00.

Como resolver isso? Se buscarmos um dia a frente pode ser que fique muito pesado para carregar toda a url

quarta-feira, 29 de abril de 2015

andamento..

Melhoria do código urgente.

prox passos: metodo getPreviousDay, ciclo por dia até a data limite, gerar url modificada c data anterior

*mudar dia str -> int

método replace http://wiki.python.org.br/ManipulandoStringsComPython

quarta-feira, 25 de março de 2015

inversão data e hora

Estava com um problema, só conseguia pegar a data e hora juntas através do crawler e essa vinha no formara "hora - data" o que dificultava colocar em uma ordem cronológica de tweets;

Consertado -> "data - hora" permitindo através de um group by exibir pelo dia que queremos. Podemos até separar data e hora em duas colunas distintas, caso a gente queira definir um limite de dias

quarta-feira, 11 de março de 2015

terça-feira, 3 de março de 2015

Selenium web driver for python <<<<-

a função scroll down está funcionando no programa teste, agora é preciso adaptá-lo e implementar no programa crawler do twitter.