Link dos arquivos: https://www.dropbox.com/sh/tmsyrlqo7jsn4o9/AADQVZPKcZEwmu9wjd32OaeJa?dl=0
Processador de tweets Faça um programa em python para analisar um conjunto de mensagens do Twitter. Seu programa deve ter as seguintes funções (utilize exatamente o mesmo nome):
● (0,5 ponto) le_tweets(): Função para ler um conjunto de tweets em um arquivo de texto e retornar esta lista. o parâmetros: nenhum o retorno: lista com os tweets
● (0,5 ponto) separa_palavras(tweet): Função seperar as palavras do tweet, por espaços. o parâmetros: string com o tweet o retorno: retorna lista de palavras do tweet
● (0,5 ponto) contaPalavrasTweet(tweet): Função para contar quantas palavras existem em um tweet. Utilize como apoio a função pronta separa_palavras(tweet) para obter a lista de palavras. o parâmetros: string com o tweet o retorno: quantidade de palavras do tweet
● (1,5 ponto) contaTotalPalavras(listaTweets): Função para contar o total de palavras de todos os tweets do arquivo. o parâmetros: lista com todos dos tweets o retorno: quantidade de palavras de todos os tweets
● (2,0 pontos) frequencia(listaTweets): Função para contar quantas vezes cada palavra aparece no conjunto de tweets Professor(a) Responsável: Fernando Sequeira Sousa
● (2,0 pontos) maisFrequente(listaPalavras listaFrequencia): Função para encontrar a palavra que mais aparece no conjunto de tweets. As palavras ‘e’, “de’, ‘a’, ‘da’ e ’em’ não devem ser consideradas, ou seja, se elas forem as que mais aparecem deve-se considerar a próxima mais frequente. Se houver duas ou mais palavras mais frequentes, considere a primeira da lista.
● (1,0 ponto) mediaFrequencia(listaFrequencia): Função para retornar a frequência média de palavras
● (1,0) medianaFrequencia(listaFrequencia): Função para retornar a frequência mediana das palavras
● (1,0) Ao final o sistema deve gerar um arquivo txt (Resultado_analise.txt) com o resultado desta análise.
o parâmetros: lista com todos os tweets o retorno: lista com as palavras que aparecem no conjunto de tweets, sem repetição; e a lista com a quantidade de vezes que cada palavra aparece o parâmetros: lista com as palavras e lista com a frequência das palavras o retorno: string com o nome da palavra que mais aparece e a quantidade de vezes que ela aparece, separando por dois ponto (:) e espaço. Por exemplo: Python: 10 o parâmetros: lista com a frequência das palavras o retorno: valor médio da frequência o parâmetros: lista com a frequência das palavras o retorno: valor mediano da frequência Repare que todas as funções tem retorno. Não deve haver nenhum comando de print nas funções Fora das funções podem colocar o que quiserem. Utilize o arquivo tweets_prova.py para fazer seus testes. Veja no arquivo resultados.pdf os resultados esperados de cada função ao testar com os tweets disponibilizados
Extra (1 ponto na média bimestral) Python disponibiliza uma biblioteca chamada tweepy (http://www.tweepy.org) para coletar mensagens diretamente do Twitter. O grupo que implementar a função le_tweets() para coletar os tweets diretamente do Twitter receberá um ponto extra na média bimestral. A função deve continuar retornando a lista de tweets.