[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]

[Burichan] [Foliant] [Futaba] [Greenhell] [Gurochan] [Photon] - [Home] [Manage] [Archive]

[Return]
Posting mode: Reply
Leave these fields empty (spam trap):
Name
Link
Subject
Comment
File
Verification
Password (for post and file deletion)
  • Supported file types are: GIF, JPG, PNG
  • Maximum file size allowed is 20480 KB.
  • Images greater than 200x200 pixels will be thumbnailed.

File: 1521156047990.webm -(3111289 B, 1920x1080) Thumbnail displayed, click image for full size.
3111289 No.4654  

Обратите внимание на то, как выглядит седьмая минута девятой серии первого сезона превосходного аниме «Yahari Ore no Seishun LoveCome wa Machigatteiru».

В ней мы видим мобильное сообщение, содержащее не одни только слова, но и подобный https://emojipedia.org/sparkles/ символ искр, и подобный https://emojipedia.org/heavy-black-heart/ символ сердца, и подобный https://emojipedia.org/ribbon/ символ бантика, и подобный https://emojipedia.org/rabbit-face/ символ лица кролика, и подобный https://emojipedia.org/pig-face/ символ лица свиньи, и другие аналогичные.

Что это за символы?

Они известны под собирательным названием https://en.wikipedia.org/wiki/Emoji (взятым из японской речи) и впервые стали употребляться именно в Японии, представляя собою важную составляющую японской культуры употребления мобильных устройств, но с тех пор успели распространиться и за пределы Японии, и за пределы мобильных устройств.

Почему я заговорил о них?

Потому, что если некоторые эмоджи (например, «✨️» или «❤️») могут на Nowere быть употреблёнными невозбранно, то некоторые другие (которых гораздо больше) употреблены на Nowere быть не могут (отображаются как груда вопросительных знаков). А это фиаско.

Можно ли как-нибудь поправить дело?

Страница https://ifmo.su/mysql-and-emoji на русском языке и страница https://stackoverflow.com/a/39465494 на английском языке как бы говорят нам, что проблема может быть заключена в том, что кодировка под названием «utf8» в базе MySQL в действительности поддерживает не все коды UTF-8, а только однобайтовые и двухбайтовые и трёхбайтовые. Если переключиться на употребление кодировки «utf8mb4», то поддерживаться начинают также и четырёхбайтовые коды (соответствующие таким символам, шестнадцатеричный номер которых в таблице Unicode выражается более чем четырьмя шестнадцатеричными цифрами). На странице https://stackoverflow.com/a/39465494 указан пример такого переключения для базы данных, и для таблицы, и для соединения; страница https://ifmo.su/mysql-and-emoji также приводит предполагаемые изменения в конфигурационном файле сайта (этот пример, по-видимому, был сочинён на языке PHP).

Если же имиджбордовый движок также содержит какие-либо фильтры, выбрасывающие из реплик «недопустимые коды», то и в фильтрах полезно сделать изменения, исходящие из допустимости более чем четырёх шестнадцатеричных разрядов в номере символа.

Исчерпывается ли полезность таких изменений только появлением более полной поддержки эмоджи?

Нѣтъ. В таблице Unicode есть и ряд других символов, номер которых содержит больше четырёх шестнадцатеричных цифр, а надобность в которых может со временем привести какого-нибудь посетителя Nowere к попытке употребить один из таких символов (и затем к огорчению в случае неудачи).

Прежде всего к этой категории относятся десятки тысяч таких иероглифов, которые ввиду количества не поместились в начале таблицы Unicode и оттого были размещены в дополнительных блоках https://en.wikipedia.org/wiki/CJK_Unified_Ideographs_Extension_B_%28Unicode_block%29 и https://en.wikipedia.org/wiki/CJK_Unified_Ideographs_Extension_C_%28Unicode_block%29 и https://en.wikipedia.org/wiki/CJK_Unified_Ideographs_Extension_D_%28Unicode_block%29 и https://en.wikipedia.org/wiki/CJK_Unified_Ideographs_Extension_E_%28Unicode_block%29 и https://en.wikipedia.org/wiki/CJK_Unified_Ideographs_Extension_F_%28Unicode_block%29

Вся японская хэнтайгана из блоков http://www.unicode.org/charts/PDF/U1B000.pdf и http://www.unicode.org/charts/PDF/U1B100.pdf также имеет пятиразрядные шестнадцатеричные номера символов.

Стрéлки из блока http://www.unicode.org/charts/PDF/U1F800.pdf и готические буквы из блока http://www.unicode.org/charts/PDF/U10330.pdf также могут представлять определённый интерес.

Нельзя обойти вниманием и то обстоятельство, что часть японских монахов-отшельников https://ru.wikipedia.org/wiki/Ямабуси принадлежала к буддистской школе https://ru.wikipedia.org/wiki/Сингон относимой в настоящее время к направлению https://ru.wikipedia.org/wiki/Сюгэндо которое практикует употребление письменности https://ru.wikipedia.org/wiki/Сиддхаматрика (третий абзац этой последней статьи в Википедии сообщает в настоящее время, что употребление сиддхаматрики только в Японии и сохраняется). И что ж с того? — а вот что: в Unicode блок сиддхаматрики http://www.unicode.org/charts/PDF/U11580.pdf также использует пятиразрядные шестнадцатеричные номера символов.

Ввиду вышеизложенного прошу о появлении на Nowere полной поддержки символов Unicode, имеющих пятиразрядные шестнадцатеричные номера символов.

>> No.4669  

И кнопку "лайк", пожалуйста.

>> No.4671  

>>4669

>И кнопку "лайк", пожалуйста.

Твоя ирония здесь не уместна. Мицгол писал не только про эмоджи.

>> No.4672  

>>4671
Без лайка не взлетит

>> No.4674  

Желающие лайков могут, вѣроятно, текстом записывать «☑️ НРАВИТСЯ» в качестве своей реплики.

>> No.4684  

>>4654
А как дела в Postgres с этим обстоят, не знаешь? Если там по умолчанию всё в порядке, то это, выходит, интересный способ определения используемой сайтом БД.

>> No.4698  
File: 1523023988417.gif -(20863328 B, 720x405) Thumbnail displayed, click image for full size.
20863328

>>4684

Не знаю.

>> No.4706  

Впрочем, пристальное вглядывание в код движка «Вакаба» может убедить читателя в том, что в движок не заложена поддержка использования PostgreSQL, так что администратор имиджборды принуждён выбирать только между MySQL и SQLite.

И так как пристальное вглядывание в документ https://sqlite.org/datatype3.html не открывает никаких ограничений на символы хранимой строки, то нетрудно догадываться, что идея >>4684 о различении между употребляемыми средствами хранения действительно может оказаться действенною, вот только различать она станет не между MySQL и PostgreSQL, а между SQLite и MySQL — да и то MySQL в тех только случаях, когда администратор просьбе >>4654 не последовал или своим умом до соответствующего шага в настройке имиджборды не дошёл.

>> No.4707  

>>4698
MySQL как бы не в одной только вакабе используется. Или это только вакаба испытывает такие трудности с кодировкой в MySQL?

>> No.4709  

>>4707

> MySQL как бы не в одной только вакабе используется. Или это только вакаба испытывает такие трудности с кодировкой в MySQL?

Любой движок испытывает, пока и если не перенастроен на «utf8mb4».

В реплике >>4654 приводился пример https://ifmo.su/mysql-and-emoji про неназванный проект.

В реплике http://410chan.org/dev/res/17371.html#19084 и двух последующих примером служит /dev/ 410чана.

>> No.4710  
File: 1523640914052.jpg -(123552 B, 1280x720) Thumbnail displayed, click image for full size.
123552

>>4654

>Yahari Ore no Seishun LoveCome wa Machigatteiru

И правда отличное аниме. Спасибо, Сергей Юрьевич.



Delete Post []
Password

[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]