В процессе работы мы сталкивались с трудностями, так как перебор объявлений, как любой автоматизированный процесс, сопровождался техническими проблемами.
Дополнительную сложность вызвала особенность «Авито», где телефоны представлены в графическом формате. Так контакты пользователей защищают от парсинга, ведь номер нельзя скопировать в виде текста.
Чтобы решить эту задачу, пришлось использовать еще один скрипт, который позволил перевести картинки в текст и собрать контакты.
С помощью скрипта программист делал скриншот и через программу переводил номер в текстовый формат. Эти действия повторялись с каждым объявлением, а полученные данные записывались в таблицу Microsoft Excel.
На этом этапе тоже не обходилось без сложностей. Связаны они были со сжатыми сроками. У нас было всего 4 дня. Мы просто не успевали сделать более тонкие настройки для сервиса, поэтому получаемые номера могли быть неточными.
Статистика такова:
- вероятность 20%, что в номере появится лишняя цифра
- вероятность 1%, что одна из цифр пропадет
- вероятность 79%, что номер будет правильным