Филолингвия
Четверг, 18.04.2024, 05:31
Приветствую Вас Гость
 
Главная страница Информация о сайтеРегистрацияВход
Меню сайта
  • Главная страница
  • Информация о сайте
  • Новости
  • Каталог статей
  • Рейтинг статей
  • Каталог ресурсов
  • Каталог ссылок
  • Как выучить английский
  • Форум
  • Фотоальбом
  • Рефераты по языкам
  • Гостевая книга
  • TOP 100
  • Методы.
  • Методики.
  • Новости языков
  • Новости английского
  • Прямой эфир.
  • Доска объявлений
  • Гостевая книга
  • TOP 100
  • Категории каталога
    Учим английские слова [381]
    Применение технических средств [119]
    Советы преподавателей [261]
    Практические советы [383]
    Английский грамматика. [100]
    Фонетика - английское произношение [51]
    Истории успеха [249]
    Секреты успеха. [102]
    Английский чтение [53]
    Тайм-менеджмент [4]
    Секреты полиглотов. [62]
    Развитие памяти [17]
    Советы психологов [56]
    Мышление на языке [53]
    Сейчас на сайте
    Онлайн всего: 1
    Гостей: 1
    Пользователей: 0
    С днем рождения!
    yuri1804(51), dianagarmash(35), donscoi(36), rivakolyada(69), Боташ(40), impaftkipPilt15059(23), Tomsinn(56), порядок(60), Crazirichard(51), Polakov(49), Ленчик777(51), Лана(61), Налья(46), алина(45), klassika(68), fillette(38), Alice2004(44), okwuann(48), ucoz_reg_2(34)
    Сегодня сайт посетили
    Система Эффективного Самостоятельного Изучения Языков
    [06.02.2019]
    Прекращение поддержки домена filolingvia.ru (0)
    [14.08.2018]
    Английский без правил! (1)
    [13.08.2018]
    Прогнозирование - это не чудо, а технология или зачем искусство стратегии тем, кто учит английский язык? (0)
    [08.03.2018]
    Тридцать два самых красивых английских слова! (0)
    [06.01.2018]
    Доброе Поздравление - 2018 от Студии Языков (0)
    [23.11.2017]
    Набор для игры "88 8опросо8" с глаголом "to buy" (0)
    [20.11.2017]
    Pushing the button - Динамика действия в реальности (0)
    [15.11.2017]
    Скачать Бесплатно Лингвокарты (0)
    [15.11.2017]
    В четверг, 16 ноября, 19.00 МСК - Интерактивная Лингвокарта. Виталий Диброва представляет новый мастер-класс на Марафоне. (0)
    [15.11.2017]
    В четверг, 16 ноября, 19.00 МСК - Интерактивная Лингвокарта. Виталий Диброва представляет новый мастер-класс на Марафоне. (0)
    [23.09.2017]
    Говорящий тренажер с "живой" Лингвокартой на 2-х языках (0)
    [20.09.2017]
    ТАВАЛЕ фестиваль: 13 - 22 октября 2017 в Харькове. Студия Языков на крупнейшем фестивале тренингов и методов развития человека! (0)
    [15.09.2017]
    You'll get the power! (0)
    [11.09.2017]
    10 лайфхаков для изучения английского каждый день (1)
    [07.09.2017]
    Прямая Линия Поддержки. (0)
    [07.09.2017]
    Второе занятие. “Лингвотренажеры - быстрый путь к беглой речи”. (0)

    Начало » Статьи » Как выучить английский » Учим английские слова

    Сколько нужно знать слов?

    Задался мыслью о том, сколько же нужно знать слов языка, чтобы смочь на нем читать и общаться. В различных местах фигурируют всякие разные цифры типа 2000 слов - минимум плюс-минус (чаще плюс:) лапоть. И лапоть может быть большим.
    Провел небольшой эксперимент - посмотрел распределение слов по частоте использования на примере "Брауновского корпуса", включающего в себя всяких разных текстов (из газет, статей, художественных книг и т.п.) суммой в миллион слов. Если считать уникальными словами все, что отделяется пробелами и знаками препинания, то в этом миллионе получается около 40 тысяч разных слов. Если же за одно слово считать все формы do (do/did/done/does/doing), все формы car (car/cars), hopeful (hopeful/hopefully) и т.д. и т.п. и учитывать всякие приставки, то уникальных слов на самом деле окажется поменьше - сколько пока не прикидывал (втрое меньше? впятеро?).

    Пролистывая список слов, упорядоченных по частоте употребления, определил, что я где-то 12-15 тысяч из 40 знаю очень хорошо (редко что-то незнакомое проскакивало), а дальше - заметно хуже.

    Потом мне стало интересно само распределение. Оказалось, что на списке из миллиона слов количество повторений слова примерно равно стам тысячам, поделенным на позицию слова в частотном списке (например, 100-е слово повторяется около 1000 раз в миллионе). Конечно, зависимость не четко обратно-пропорциональная, но качественно и количествеено ее очень и очень напоминает.

    А теперь главное... Если проскладывать повторения слов с самого первого (the) до того, которое примерно приходится на конец твоих познаний, и поделить на полное количество слов корпуса, то можно очень грубо оценить в процентах понимание текста корпуса и даже знания языка.

    Складывать повторения влом, по-этому беру свое примерное обратно-пропорциональное распределение и считаю интеграл...
    Считаю интеграл от 1 (позиция слова the) до N (позиция последнего известного мне слова) от выражения 105/x.
    Получаю 105 * ln(N).
    К миллиону это будет 10 * ln(N) %.

    Расклад следующий:

    N (тысяч) % корпуса
    0.1       46
    0.5       62
    1         69
    2         76
    4         83
    8         90
    12        94
    16        97
    20        99
    32        103
    40        106


    Да, да, не может (не должно) быть больше ста процентов, но распределение я выбрал грубое (на самом деле the встретится 70 тысяч раз на миллион, а не 100 тысяч по моему распределению - вот уже и 3% лишних у меня объясняются), и считать нужно было сумму, а не интеграл. Все это правда, но тем не менее...

    Что мы видим из таблицы:
    1. В целом, наиболее эффективно учить слова, начиная с самых частых и продолжая в порядке убывания частоты использования, что вроде-бы очевидно. Нужен только частотный словарь/список чтобы его придерживаться.
    2. Следствия к предыдущему пункту: если учили как вышло, без частотного списка, то можно подметить очевидные пробелы в знаниях, глядя в список, на незнакомые слова, расположенные между знакомыми. А можно узнать примерно где вы находитесь, вспомнить, что вы знали, но забыли, или забыли, что знали. :)
    3. 50% корпуса покрывается где-то 500-ми самыми частыми словами, 75% - 4-мя тысячами, 90% - 16-ю тысячами.
    4. Каждые последующие 7% приходят с удвоением словарного запаса. Каждый последующий процент дается все более трудно, особенно после 75% или 4-х тысяч слов. Нужно еще не забывать, что запоминается слово тем чаще, чем употребляется, а значит под конец дело усложняются не только за счет удвоения на каждые 7%, но и еще из-за того, что эти новые 7% более редкие, чем все, что было выучено до них.
    5. Следствие предыдущего пункта: язык можно учить практически бесконечно. :) Даже родной. :))

    В 4-м пункте можно еще одну оценку дать. Положим, слово находится на позиции x в частотном списке. Сколько в среднем нужно прочесть слов, прежде чем это слово встретится один раз? Считаем... В нашем миллионе число встретится 105/x раз. А нужно 1.
    Делим. 106/(105/x) = 10 * x.
    Т.е. слово встретится через 10 * x слов, где x - позиция этого слова в частотном списке. И, например, слово на 5000-й позиции появится через 50000 слов или, если принять 300 за кол-во слов на странице книги, 167 страниц. А тысячное - всего через 33.

    Так сколько же нужно знать слов чтобы читать и общаться на языке?

    А фиг его знает. :) Число зависит от того, как хорошо требуется знать язык, в какой области, от того какие слова учить, и от того, как эти слова считать (ну, или что считать уникальным словом). Еще стоит не забывать про то, что слова в языке часто имеют несколько различных смыслов, а также достаточно часто объединяются в пары, тройки и более длинные выражения, которые нередко несут дополнительный смысл по отношению к индивидуальным значениям составляющих слов (вспоминаем фразовые глаголы и идиомы и моментально хватаемся за голову :).

    Но без двух-четырех тысяч наиболее употребимых слов никак не обойтись. Если знать меньше, то половина смысла книг точно пройдет мимо, а то и больше. К слову, я уже достаточно уверенно читаю по-испански, зная более двух тысяч слов. Недавно книгу прочел практически без словаря (нарочно) и не очень сильно мучался при этом.

    P.S. в средней книжке около ста тысяч слов (80 - 150). Миллион слов - это десяток книг. Очевидно, что частотный список будет зависеть от того, какой корпус брать по размеру и типу вошедших в него текстов (сравните политические или экономические новости с любовным романом или научным трудом).

    Источник: http://archaicos.livejournal.com/78467.html
    Категория: Учим английские слова | Добавил: sveta (19.02.2009) | Автор: archaicos
    Просмотров: 6533 | Комментарии: 1 | Рейтинг: 5.0 |
    Вы овладеете английским!
    • Вы верите, что всего за несколько часов можно понять, как поставить правильное произношение, не изучая долго и нудно теоретическую фонетику, а всего-лишь поймав "фокус" языка?
    • Вы верите, что за несколько часов можно понять всю систему английских времен, которую безуспешно учат годами в школе, институте или на курсах?
    • Вы верите, что вместо скучных учебников можно заниматься по Вашим любимым фильмам и сериалам, испытывая при этом восторг и наслаждение от занятий английским?
    Мы не только верим, а и твердо убеждены, так как уже сотни людей прошли по этому пути и поделились с нами своми успехами и достижениями!
    И мы верим в Вас, потому что Вы легко научились говорить на языке, который на порядок сложнее английского!
    Поэтому более простым и логичным английским Вы овладеете гораздо быстрее и легче! Конечно,если будете делать это правильно, естественным путем - моделируя носителей языка.
    Руководствуясь при этом не громоздкими правилами, а простыми и понятными визуальными моделями!


    Получите бесплатно материалы - подпишитесь на рассылку!
    Подписка на рассылку
    Никакого спама, гарантируем!


    Получите результат немедленно - приступайте к занятиям прямо сейчас!

    Получить Лингвокарты
    Никакого спама, гарантируем!

     


    Всего комментариев: 0
    Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]

    Подпишись на RSS ленту
    RSS лента
    Форма входа
    Рекомендуем
        

    Друзья сайта
    Статистика
    Прямой эфир
    Copyright Filolingvia © 2007-2009
    Сайт управляется системой uCoz