?

Log in

No account? Create an account
Бизнес-идея
BlackEyed
windcryomancer
Зачем делать новые гробы, когда можно ремонтировать старые?
1570492989_15

Гигантское хокку
BlackEyed
windcryomancer
"Я не мог заснуть -
Дождь шумел за окном,
И работали какие-то моторы.
Непонятно было как
Мне лежится в кровати:
Не жарко, не холодно, но как-то неуютно.
Вроде был спокоен,
И мыслей тяжёлых не было,
А сон не шёл и я уже начал расстраиваться.
Тогда я встал и принял пару таблеток успокоительных трав.
После этого лёг и заснул.
И вот думаю:
То ли успокоительное помогло,
То ли сама мысль что принял таблетки,
То ли наконец-то заснул естественным путём)"

- Это твое?)

- Да)
Только что написал)

- В конце должно быть
Плачет сакура

- Какая сакура: октябрь на дворе!
Я - за реализм!

- ПОЭТОМУ И ПЛАЧЕТ

Несвежие новости
BlackEyed
windcryomancer
"В одном из частных домов города Татарска Новосибирской области произошла драка из-за алюминиевых кастрюль, сковородок и газовых горелок.
Неизвестный ворвался в коттедж и попытался вынести утварь на глазах у хозяев. Владельцы дома оказали сопротивление, но злоумышленнику все же удалось завладеть посудой.
Потерпевшие обратились в полицию, и спустя некоторое время похититель скарба был задержан.
Им оказался 42-летний безработный, который ранее в поле зрения оперативников не попадал и к уголовной ответственности не привлекался."
Прямо сюжет для РенТВ
Про психическое воздействие инопланетных жидомасонов
И ещё идея для РенТВ:
Списки посторонних предметов в анусе неоднократно уже составлялись и публиковались, вот взять и на их основе провести расследование того как жыдорептилоиды издеваются над людьми.
Потому что сами-то люди явно до такого додуматься не могут.
Ни один человек такого сам не сделает.
Явная садистская отработка психотронных технологий.

Мысли на голодный желудок
BlackEyed
windcryomancer
 - А что вы делаете со страхом?
 - Я его испытываю.

Ещё игры с буквами
BlackEyed
windcryomancer
Потом пришла в голову мысль собрать такую статистику не из словаря, а из естественной речи. Получить первые буквы не всех слов русского языка вообще, а с учётом их употребительности.
Пошёл на http://ruscorpora.ru/new/corpora-freq.html. Там можно взять файл статистики словоупотреблений, построенный на основе основного корпуса русского языка.
Как объясняется на сайте:
"В Национальный корпус русского языка включены прежде всего прозаические оригинальные тексты, представляющие русский литературный язык (с начала XVIII века), но также и (в меньшем объёме) переводные сочинения (параллельно с оригиналом), поэтические тексты, а также тексты, представляющие нелитературные формы современного русского языка: разговорную (записи устной речи, публичной и непубличной), диалектную.
Основной корпус текстов
Основной корпус — тексты, представляющие русский литературный язык, — можно подразделить на два главных массива, имеющих свои особенности: это современные письменные тексты (середина XX — начало XXI века) и ранние тексты (середина XVIII — середина XX века)."
Вот из этих текстов общим объёмом 192689044 словоформы и взял список словоформ, отсортированный по частоте встречаемости, обрезанный по частоте 3.
Распаковал архив в файл Ruscorpora_words.txt и выполнил команду:
$ head -n 30 Ruscorpora_words.txt
6829968 и
5190215 в
3164900 не
2729210 на
2064408 с
2064178 что
1146383 как
1092177 я
1046292 к
1040711 он
970931  по
962330  а
930432  его
786062  из
729569  это
710530  от
695687  все
690644  за
672751  у
664879  же
661111  то
652455  В
638138  но
614116  о
586748  И
579068  А
576491  было
541041  для
534512  так
499950  Я

Словоформы различаются по регистру букв. Избавился от этого и от первого столбца с количеством вхождений в корпус:
$ head -n 30 Ruscorpora_words.txt | awk '{print tolower($2)}'
и
в
не
на
с
что
как
я
к
он
по
а
его
из
это
от
все
за
у
же
то
в
но
о
и
а
было
для
так
я

Так как сортировка по встречаемости уже не нужна, надо посчитать количество вхождение букв в список, то сортирую слова, убираю совпадения, выделяю первые буквы и подсчитываю их:
$ head -n 30 Ruscorpora_words.txt | awk '{print tolower($2)}' | sort | uniq | grep -Eo '^.' | uniq -c
    1 а
    1 б
    2 в
    1 д
    1 е
    1 ж
    1 з
    2 и
    2 к
    3 н
    3 о
    1 п
    1 с
    2 т
    1 у
    1 ч
    1 э
    1 я
Сортирую по количеству вхождений:
$ head -n 30 Ruscorpora_words.txt | awk '{print tolower($2)}' | sort | uniq | grep -Eo '^.' | uniq -c | sort
    1 а
    1 б
    1 д
    1 е
    1 ж
    1 з
    1 п
    1 с
    1 у
    1 ч
    1 э
    1 я
    2 в
    2 и
    2 к
    2 т
    3 н
    3 о

Это первые тридцать слов по встречаемости в корпусе. Не очень показательно. Расширяю количество обрабатываемых слов:
$ head -n 3000 Ruscorpora_words.txt | awk '{print tolower($2)}' | sort | uniq | grep -Eo '^.' | uniq -c | sort
    1 a
    1 c
    1 d
    1 e
    1 f
    1 n
    1 o
    1 p
    1 s
    1 v
    1 й
    2 0
    2 4
    2 6
    2 7
    2 8
    2 9
    2 ю
    3 5
    3 i
    5 3
   12 1
   15 я
   17 2
   17 ф
   17 ш
   18 э
   21 е
   21 ц
   25 а
   37 ж
   40 х
   54 л
   60 ч
   70 у
   74 з
   77 и
   88 б
   92 г
   97 т
  116 р
  133 м
  146 к
  174 д
  174 о
  186 н
  232 в
  347 п
  366 с

Забавно: в первых трёх тысячах встречаются латинские буквы и цифры.
Надо вообще-то научится дружить с gnuplot чтобы сразу же рисовать и графики.

Последние буквы русских слов
BlackEyed
windcryomancer
Зачем останавливатся когда можно идти до конца?
Вообще-то там есть обратный (инверсионный) cловарь (а, ба, аба, кааба, ... совершеннолетняя, несовершеннолетняя), но уже проще воспользоваться тем что есть.
Список последних букв русских слов:
$ grep -Eo '.$' RusDictionary_straight.txt | sort | uniq -c
10895 а
  157 б
  356 в
  440 г
  762 д
 4627 е
   74 ё
  182 ж
  463 з
  996 и
20856 й
 5294 к
  623 л
 1184 м
 1766 н
 2135 о
  280 п
 1996 р
  793 с
 2731 т
  214 у
  178 ф
  188 х
  852 ц
  132 ч
  139 ш
   16 щ
  316 ы
23803 ь
    4 э
   66 ю
10874 я
Правда, получается отсортированным по буквам, а не по числам.
Относительные частоты:
$ grep -Eo '.$' RusDictionary_straight.txt | sort | uniq -c | awk '{n+=$1; quants[$2]=$1} END {print "Total: "n; for(i in quants) print i, "\tabsolute:", quants[i], "\trelative to",n":", quants[i]/n}'
Total: 93392
п       absolute: 280   relative to 93392: 0.00299812
в       absolute: 356   relative to 93392: 0.00381189
ы       absolute: 316   relative to 93392: 0.00338359
г       absolute: 440   relative to 93392: 0.00471132
ь       absolute: 23803         relative to 93392: 0.254872
д       absolute: 762   relative to 93392: 0.00815916
э       absolute: 4     relative to 93392: 4.28302e-05
р       absolute: 1996  relative to 93392: 0.0213723
е       absolute: 4627  relative to 93392: 0.0495439
ю       absolute: 66    relative to 93392: 0.000706699
с       absolute: 793   relative to 93392: 0.00849109
ж       absolute: 182   relative to 93392: 0.00194878
я       absolute: 10874         relative to 93392: 0.116434
т       absolute: 2731  relative to 93392: 0.0292423
з       absolute: 463   relative to 93392: 0.0049576
у       absolute: 214   relative to 93392: 0.00229142
и       absolute: 996   relative to 93392: 0.0106647
ф       absolute: 178   relative to 93392: 0.00190594
й       absolute: 20856         relative to 93392: 0.223317
ё       absolute: 74    relative to 93392: 0.000792359
х       absolute: 188   relative to 93392: 0.00201302
к       absolute: 5294  relative to 93392: 0.0566858
ц       absolute: 852   relative to 93392: 0.00912284
л       absolute: 623   relative to 93392: 0.00667081
ч       absolute: 132   relative to 93392: 0.0014134
м       absolute: 1184  relative to 93392: 0.0126777
ш       absolute: 139   relative to 93392: 0.00148835
н       absolute: 1766  relative to 93392: 0.0189095
а       absolute: 10895         relative to 93392: 0.116659
щ       absolute: 16    relative to 93392: 0.000171321
о       absolute: 2135  relative to 93392: 0.0228606
б       absolute: 157   relative to 93392: 0.00168109
Переходя в редактор таблиц:
ь 23803
й 20856
а 10895
я 10874
к 5294
е 4627
т 2731
о 2135
р 1996
н 1766
м 1184
и 996
ц 852
с 793
д 762
л 623
з 463
г 440
в 356
ы 316
п 280
у 214
х 188
ж 182
ф 178
б 157
ш 139
ч 132
ё 74
ю 66
щ 16
э 4

Диаграмма:
DiagramRev
Тут всё ожидаемо: "ь" и "й". И характер распределения отличается, как и должно быть.

Четыре слова, оканчивающихся на "э": "алоэ", "каноэ", "удэ" и само "э".
При этом нет слов заканчивающихся на твёрдый знак. Как и начинающихся. Но все остальные буквы представлены.

Первые буквы русских слов
BlackEyed
windcryomancer

Давно было интересно посчитать что-нибудь в русском тексте. И потренироваться в bash.

В качестве источника взят cловарь А. А. Зализняка с обычным (лексикографическим) порядком следования (а, а-конто, а-ля, аба, абажур... ящурка, ящурный) отсюда: http://speakrus.ru/dict/index.htm

Сохранил словарь в файл RusDictionary_straight.txt

Так как каждое слово расположено на отдельной строке то команда:

$ wc -l RusDictionary_straight.txt
93392 RusDictionary_straight.txt

говорит что в словаре всего 93392 слова

Первые символы слов, отсортированные по убыванию количества:

$ grep -Eo '^*.' RusDictionary_straight.txt | uniq -c | sort -r
16433 п
 8983 с
 6622 о
 6089 в
 5719 к
 5388 н
 5010 р
 4374 з
 3799 м
 3733 б
 3711 д
 3137 т
 2680 г
 2641 а
 2591 у
 2423 и
 1850 л
 1512 ф
 1312 ш
 1162 э
 1057 х
 1056 ч
  661 ж
  519 ц
  317 я
  249 е
  190 щ
  124 ю
   23 ё
   19 й
    7 -
    1 ы

Для проверки посчитал сумму цифр в первом столбце:
$ grep -Eo '^*.' RusDictionary_straight.txt | uniq -c | awk '{n+=$1} END {print n}'
93392
сумма сходится.

Для подсчёта относительной частоты букв команда получается монструознее:
$ grep -Eo '^*.' RusDictionary_straight.txt | uniq -c | sort -r | awk '{n+=$1; quants[$2]=$1} END {print "Total: "n; for(i in quants) print i, "\tabsolute:", quants[i], "\trelative to",n":", quants[i]/n}'
Total: 93392
в       absolute: 6089  relative to 93392: 0.0651983
п       absolute: 16433         relative to 93392: 0.175957
ы       absolute: 1     relative to 93392: 1.07076e-05
г       absolute: 2680  relative to 93392: 0.0286962
д       absolute: 3711  relative to 93392: 0.0397357
е       absolute: 249   relative to 93392: 0.00266618
э       absolute: 1162  relative to 93392: 0.0124422
р       absolute: 5010  relative to 93392: 0.0536449
ю       absolute: 124   relative to 93392: 0.00132774
ж       absolute: 661   relative to 93392: 0.00707769
с       absolute: 8983  relative to 93392: 0.096186
я       absolute: 317   relative to 93392: 0.0033943
т       absolute: 3137  relative to 93392: 0.0335896
з       absolute: 4374  relative to 93392: 0.0468348
-       absolute: 7     relative to 93392: 7.49529e-05
и       absolute: 2423  relative to 93392: 0.0259444
у       absolute: 2591  relative to 93392: 0.0277433
й       absolute: 19    relative to 93392: 0.000203444
ё       absolute: 23    relative to 93392: 0.000246274
ф       absolute: 1512  relative to 93392: 0.0161898
х       absolute: 1057  relative to 93392: 0.0113179
к       absolute: 5719  relative to 93392: 0.0612365
ц       absolute: 519   relative to 93392: 0.00555722
л       absolute: 1850  relative to 93392: 0.019809
ч       absolute: 1056  relative to 93392: 0.0113072
м       absolute: 3799  relative to 93392: 0.040678
ш       absolute: 1312  relative to 93392: 0.0140483
а       absolute: 2641  relative to 93392: 0.0282787
н       absolute: 5388  relative to 93392: 0.0576923
щ       absolute: 190   relative to 93392: 0.00203444
б       absolute: 3733  relative to 93392: 0.0399713
о       absolute: 6622  relative to 93392: 0.0709054

Сортировка куда-то поехала, но и пусть, всё равно сортировка по процентам ведь осталась та же.

Дальше нужно построить график, но тут сил у меня не хватило и я взял и засунул предыдущие результаты в редактор таблиц и там построил график:

Не ожидал такого... Да ещё от буквы "п"...
Может это из-за того что много приставок на "п" начинаются и все они продуктивные, ко многим словам могут быть присоединены. А может и нет. Но такой выброс меня удивил.




Nuclear Disarment
BlackEyed
windcryomancer
Я в детстве постарадал от взрыва атомной бомбы.
Это случилось ночью, я спал в кровати. Дом тряхнуло, я упал на пол, ушибся, проснулся, испугался, заплакал...
С тех пор я выступаю за ядерное разоружение.

Шестой ангел
BlackEyed
windcryomancer
Почему мне в голову пришёл именно шестой ангел? А не пятый и не второй?
Нет, "Шестого лесничего" я не знаю.
Мне запала в память другая песня: Танцы на воле - "Телевизионный снег"



Одним ударом сокрушит наши замки из песка
Ветер - бешеная сила, засыпая нам глаза.
Остановится время и заводские трубы
Протрубят как шестой ангел, сжав немые губы.
Всё что видишь - то сгорит,
Всё что слышишь - умрёт,
И засыпется навеки с неба
Снегом.


Вот потому и шестой.

Современные реалии
BlackEyed
windcryomancer
В известном источнике в главе девятой, в стихе тринадцатом говорится: "Шестой Ангел вострубил...".
В наше время это принимает форму: "Шестой блогер возбомбил"...

Вот оно что
BlackEyed
windcryomancer
11 сентября 1971 года, ровно за 30 лет до теракта, умер Никита Сергеевич Хрущев, который, как известно, обещал показать американцам "кузькину мать".

Имитация
BlackEyed
windcryomancer
Говорят, есть имитация чёрной икры из нефти.
Предлагаю новый высокотехнологичный продукт для ншей страны - имитация секса из нефти.

Подборки прикольных и забавных картинок
BlackEyed
windcryomancer
Замечаю за собой, что когда я смотрю подборки прикольных картинок я узнаю людей на них... Это что-то говорит о моём культурном багаже...
Ну или о возрасте, но это только в связке с хорошей памятью.

Фиолетово
BlackEyed
windcryomancer
jeYhjk9uKHw
 - Этим ты показываешь что тебе всё фиолетово?)
- Да. На весь мужской род;)

Представления о котокафе
BlackEyed
windcryomancer
Я не знаю как работает котокафе. Но мне приятно думать что когда посетитель просит счёт, то работник котокафе подходит и спрашивает котов, с которыми общался посетитель и те ему рассказывают на сколько он их нагладил и на сколько они на нём полежали и потоптались лапами. И в зависимости от кошачьих оценок посетителю выставляют счёт.

Свежие новости
BlackEyed
windcryomancer
В американском штате Арканзас полиция задержала двух пьяных мужчин, которые поочередно надевали пуленепробиваемый жилет и стреляли друг в друга.
Инцидент произошел в воскресенье, 31 марта. 50-летний Чарльз Юджин Феррис выпивал вместе с 36-летним другом Кристофером Хиксом у себя дома.
Феррис примерил бронежилет и попросил Хикса выстрелить в него из винтовки. Пуля прошла сквозь защиту и оставила на его груди кровоподтек.
Затем он передал пуленепробиваемый жилет Хиксу и сделал пять выстрелов в его спину. Пули не пробили материал, но оставили на коже синяки. Спустя время Феррис пожаловался супруге на боль в груди, та отправила его в больницу.
Но самое интересное, это что сочиняют:
Феррис сообщил врачам иную версию произошедшего. По его словам, неизвестный якобы заплатил им 200 долларов (13 тысяч рублей), чтобы они сопроводили мужчину в лес. В результате произошла перестрелка, объяснил американец.
Обычно такие странные незнакомцы встречаются людям, которые попадают в больницу с инородными телами в анусе.
"А потом у меня в анусе оказался огурец"
Позже приехала супруга пострадавшего и рассказала следователям правду. Полиция задержала мужчин. Феррис признался, что выдумал историю, чтобы его друг Хикс избежал наказания.
Слабак, раскололся.
Надо было упорно стоять на версии о незнакомом дядьке, который даёт деньги, заводит в лес, а потом налетели мексиканские наркобароны, которые хотели купить ядерный реактор у исламистов, чтобы кипятить на нём кокаин.
Но тут над лесом зависает самолёт и из него десантируются конные войска КГБ, которые хотят отобрать обратно украденный у них реактор.
С деревьев прыгают ниндзя, по деревьям прыгают шаолиньские монахи, хорошо что у меня был бронежилет!
Когда из земли полезли шахтёры верхом на кротах-мутантах, я понял что пора сваливать, чёрт с ними с деньгами!
Там такое мясо было, пули свистели над головой, кучу народу повалили, просто на куски разорвали, я подумал что двести долларов мало за такое удовольствие и ушёл, оставил того мужика там.
Он оказался Бен-Ладеном, который по заданию китайской разведки ушёл в подполье и скрывался на территории США.
Иногда нанимал местных жителей для различных мелких поручений.
Мне ещё повезло - просто в лес сходить попросил, а некоторым он ведь огурцы в анус засовывал.
Вот так всё было товарищ начальник.


Не только всякая похабень и сортирщина мне лезет в голову
BlackEyed
windcryomancer
Не только всякая похабень и сортирщина мне лезет в голову, иногда приходят интересные словосочетания. Например, название для какого-то интеллектуального произведения искусства:
"Хрупкость воздуха"
Фильм, картину, музыкальный альбом так можно назвать. Вызывает раздумья и попытки представить что же это может означать.

Математика денег
BlackEyed
windcryomancer
Не зря в различных программных средах вводится отдельный тип данных "деньги". Они отличаются от чисел тем, что у них есть минимальная единица, которая дальше не делится. То есть после запятой может быть только два знака. Казалось бы, мелочь, но регулярно возникают ситуации, в которых это проявляются.
Столкнулся как раз с примером где это проявилось.

Берём селёдку с ценой 138 рублей за килограмм. То есть 138,00 за 1,000. Не знаю, есть ли такая, просто взял эти цифры чтобы возникла особая ситуация.

  • Продаём 412 грамм селёдки:

  • 138,00 * 0,412 = 56,856 округляем до 56,86

  • Продаём 67 грамм этой же селёдки:

  • 138,00 * 0,067 = 9,246 округляется до 9,25

  • Суммарная стоимость получается: 56,86 + 9,25 = 66,11

  • Теперь купим эту селёдку одной порцией, сразу 0,412+0,067 = 0,479 грамм:

  • 138,00 * 0,479 = 66,102 округляем до 66,10

Получается на одну копейку меньше.
Это даже никакая не ошибка, это нормальное следствие того что количество знаков после запятой у денежных сумм ограничено.
Естественно это проявляется не всегда, если взять не 412 и 67 грамм, а например 413 и 67, то суммы сойдутся.
Если цена у товара будет другая, то такая ситуация возникнет с другими количествами, хотя не проверял: может быть есть такая цена, что у товара не возникнет подобного расхождения, ведь вес тоже нельзя дробить произвольно, он ограничен граммами - три знака после запятой, так что может быть что если перебирать по одному грамму, то какая-то цена не даст такого расхождения ни в каком количестве.
Интересно было бы оценить количество таких пар среди всех возможных количеств товара, когда цена за сумму количеств не равна сумме цен за каждое количество по отдельности.
То есть (x + y)*Z != x*Z + y*Z, при этом x и y имеют три знака после запятой, Z - только два, и все результаты умножений округляются до двух знаков.
Мне кажется что можно проверять количества только до килограмма, больше смысла не имеет, ведь расхождение только в последней копейке.

Панковская поэзия
BlackEyed
windcryomancer
Что-то мне в голову в последнее время лезут всякие названия в стиле панк: "Эвфемизм онанизма", "Тряпочка для очка"...

Народная мудрость
BlackEyed
windcryomancer
Встречают по одёжке, а провожают по пердёжке.