Очень много мусора попадается при парсинге твиттера по ключам. Очень много.
Нужны фильтры, как, например, в Ultimate Comment Scraper:
http://gyazo.com/458bb69dfe22b81891c561d3735455bc.png?1363810245
Сделано + добавлена возможность устанавливать порог вхождения кириллицы/латиницы в тексте твита. http://autosed.com/forum/showthread.php?t=1275&p=27039&viewfull=1#post27039