Показать сообщение отдельно
Старый 27.08.2015, 20:19   #2
Nerd
Чудо-кот
 
Аватар для Nerd
 
Регистрация: 22.02.2011
Сообщений: 901
Написано 480 полезных сообщений
(для 1,471 пользователей)
Ответ: Список существительных

Можно дампнуть из wiktionary ([1] [2])

Скрипт на Python 2.x:

import urllib2
import json
import time

url = "https://ru.wiktionary.org"
cat = "%D0%9A%D0%B0%D1%82%D0%B5%D0%B3%D0%BE%D1%80%D0%B8%D1%8F%3A%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B5_%D1%81%D1%83%D1%89%D0%B5%D1%81%D1%82%D0%B2%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5"
# dlya zashifrovki stroki ispolzoval vot eto: http://meyerweb.com/eric/tools/dencoder/
# vpervie v zhizni kuryu Python, hz gde tut u vas vrubaetsa utf-8

output = open("out.txt","wb")

cont = ""
while True:
  print "."*(int(time.time())%4+1)
  data = json.loads(urllib2.urlopen(url+"/w/api.php?action=query&format=json&list=categorymembers&cmlimit=500&cmtitle="+cat+cont).read())
  for page in data[u'query'][u'categorymembers']:
    output.write(page[u'title'].encode('utf8')+'\n')
  if(not (u'continue' in data)):
    break
  cont = '&cmcontinue='+data[u'continue'][u'cmcontinue']
Вложения
Тип файла: txt существительные.txt (2.23 Мб, 47395 просмотров)

Последний раз редактировалось Nerd, 27.08.2015 в 22:46.
(Offline)
 
Ответить с цитированием
Эти 6 пользователя(ей) сказали Спасибо Nerd за это полезное сообщение:
ABTOMAT (29.08.2015), Gector (28.08.2015), impersonalis (29.08.2015), moka (28.08.2015), Randomize (28.08.2015), St_AnGer (28.08.2015)