Вы отмечаетесь в комментариях - а я честно говорю вам то, что думаю о вас.
Вы же в ответ размещаете у себя такой же пост.

это была присказка, а сказка впереди. Корпус языка - это индекс многих-многих текстов. То есть, по сути, это проекция некоего идеального языка, которого, естественно, не существует, mind you, на действительность. Писатели, устная речь, публицистика. Корпус русского языка создаётся с 2003 года, он всё ещё далёк от завершения (там нет слова "говнозеркалка", но есть словосочетание "горячее кофе".

нужны корпуса в первую очередь для теоретиков - чтобы не исследовали то, чего в языке нет, а занимались тем, что уже есть, постепенно переходя от часто встречающихся примеров к реже встречающимся. Но и в практической работе - редакторам, писателям, переводчикам - такой корпус мог бы сильно помочь. Он переводит гипотетические примеры из разряда "так говорят" в доказанные.

Так вот. Русский корпус - это, пожалуй, единственное, чем я могу гордиться в этой стране. Не всё ещё умерло

русский корпус - ruscorpora.ru/
американский - www.americancorpus.org/
британский (платный) - www.natcorp.ox.ac.uk/

P.S. Жалко, я о нём только сегодня узнал. для курсовой бы сгодился в самый раз.