[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]

[Burichan] [Foliant] [Futaba] [Greenhell] [Gurochan] [Photon] - [Home] [Manage] [Archive]

[Return]
Posting mode: Reply
Leave these fields empty (spam trap):
Name
Link
Subject
Comment
File
Verification
Password (for post and file deletion)
  • Supported file types are: GIF, JPG, PDF, PNG
  • Maximum file size allowed is 20480 KB.
  • Images greater than 200x200 pixels will be thumbnailed.

File: 1456168758231.jpg -(474036 B, 1102x622) Thumbnail displayed, click image for full size.
474036 No.126706  

Предположим есть n снимков некого объекта низкого качетсва. Как можно из них получить один но более высого качества? Есть ли готовые решения для подобного?

>> No.126709  

А вот хрен его знает. Может, никак. Если подойти к вопросу с точки зрения того, какую информацию снимки содержат, то может оказаться, что все снимки вместе не содержат достаточно информации, чтобы получить из них один более высокого качества. Например, на объект может быть нанесена некоторая надпись такого размера, что на всех снимках она видна как одно размытое пятно. Ни один из снимков не содержит достаточно информации, чтобы восстановить эту надпись. И все снимки вместе взятые тоже не содержат достаточно информации, чтобы восстановить надпись. Выходит, получить достаточное качество, чтобы надпись была видна, невозможно.

А вообще твой вопрос можно перефразировать так. Есть n датчиков. Каждый датчик со своим шумом (а шумы бывают разные, с разными параметрами; но в данном случае, допустим, что тип шума одинаков и параметры шума одинаковы для всех датчиков). На вход датчиков подаётся одинаковый сигнал f(t). Насколько возможно избавиться от шумов в этих условиях и получить исходный сигнал?

Вот теперь задача более-менее математически сформулирована. Шум от датчика i обозначим Ni(t). Тогда сигнал на выходе датчика i будет Oi(t) = f(t) + Ni(t). Теперь вопрос. Если просуммировать Ni(t) и поделить на количество датчиков, то получишь ли ты нечто близкое к нулю? Если да, то можно получить нечто близкое к f(t), просуммировав Oi(t) и поделив на n. Если нет, то всё сложнее.

Кстати, когда ты делаешь фото всё ещё сложнее. Исходный сигнал (свет, отражённый от объекта) помимо шума ещё получает пикселизацию, то есть твой сигнал становится более «квадратным».

Вот такие мысли у меня на этот счёт. Вообще, похоже на то, что эта задача из области обработки сигналов. Хрен его, погугли по этой теме что нибудь. Я в этой теме не эксперт.

>> No.126710  

>>126706

Знакомые такой стартап пилили, но вроде обосрались на поиске инвестора, потому что инвесторам такое непонятно.

>> No.126711  
File: 1456186934466.png -(1342097 B, 1202x1600) Thumbnail displayed, click image for full size.
1342097

>>126706>>126709

  1. пилишь нейросеть
  2. тренируешь на зашумление с n ракурсов
  3. профит
>> No.126715  

это от фотографа зависит. что значит «низкое качество», горизонт завален?
>>126709

>просуммировать Ni(t) и поделить на количество датчиков

получишь ты среднее арифметическое показаний датчиков в момент измерения. «кстати, о птичках», лучше взять медианный фильтр, он минимизирует ошибку при импульсной помехе или выходе одного датчика из строя
проблема в том, новой информации здесь не появляется, а происходит отбрасывание крайних значений. способ создания новой информации — синтез, для дискретного набора оценок, соответственно, интерполяция
вот если бы измерения происходили со сдвигом фаз, в результате чего мы могли бы поиметь несколько наборов оценок, для 0φ, 1φ, 2φ,..., то совместив их вместе смогли расширить разрешение

>> No.126716  

Тут ещё такой вопрос, где провести грань между полезной информацией и мусором. Анон выше верно заметил про интерполяцию, для отсеивания понадобится дискретная фильтрация снимка, а в итоге можно получить вообще информационную яму, потому что после совмещения двух снимков их опять же надо чистить от шумов.
По идее алгоритм таков: написать/найти функцию фильтрации шумов по слоям с некоторым квантификатором и коэффициентом погрешности и сделать обработку по бинарному дереву (то есть сначала каждый снимок по отдельности, потом пары совмещенных и так далее, пока не останется один финальный). С первого раза не получится, нужно будет играться с коэффициентами.
Советую приглядеться к современным форматам картинок и перекодированию изображений. Там уже присутствуют механизмы уменьшения погрешностей, блочности, шумов и прочего, так что может и незачем изобретать велосипед.

>> No.126718  

>>126706
Есть сотни способов. Можно их склеить, можно собрать статистику о изменениях в снимках и внести поправки. Любое фото в своём роде сейчас проходит сравнение с результатами других фото. Это моя работа, так что задавай более конкретные вопросы.

>> No.126720  

Просто в фотошопе полупрозрачные слои слить. Ещё есть программа, для HDR из нескольких фоток с разной экспозицией, тоже прекрасно справляется.

>> No.126724  
File: 1456215119414.jpg -(106864 B, 1149x756) Thumbnail displayed, click image for full size.
106864

>>126715

> что значит «низкое качество», горизонт завален?

Например низкое разрешение.
>>126718
Есть ли готовый софт для такого?

>> No.126725  

>>126724
Фотошоп. Для каждой задачи есть свои софтины, на телефоны почти полный набор есть. Сдк почти на все есть. Я работаю со стороны железа, так что байтовый хардкор. Существует набор стандартных тестов. Склеивать можно тоже разными способами. Склеивают и просто и субпиксельно. Склейка снимков с двух фотоприёмников для увеличения разрешения снимков было темой моей незаконченной кандидатской в некотором роде. Задавай конкретные вопросы, потому что для "этого", могут быть разные софтины и разные сдк

>> No.126726  

Дай сюда, посмотрю, что можно сделать.

>> No.126728  
File: 1456221979265.jpg -(201471 B, 1024x768) Thumbnail displayed, click image for full size.
201471

>>126725

> Фотошоп

Не слышал о подобном функционале в нем

> Для каждой задачи есть свои софтины, на телефоны почти полный набор есть

Например стоит задача получить большее разрешение из нескольких фотографий меньшего.
>>126726
Интересует все-таки автоматизированное или хотябы полуавтоматизированное решение. Боюсь если тебе скинуть миллион фоток то ты быстро устанешь.

>> No.126729  

>>126728
Руками в фотошопе, при привычке клеится гораздо более eye candy. Как ты снимал фото? Какие у тебя входные данные? Ты снимал с разных положений или статично? Какой тип матрицы, какие у неё стояли настройки? Есть ли координаты матриц на входе? Фокусное расстояние, геометрия фотоприемника и объектива какая? На выходе ты хочешь что получить, панорамный снимок с перекрытиями, 3д, фотограмметрические координаты, просто снимок покрасивше? Может у тебя вообще такая ситуация, когда тебе нужно что либо склеивать и только из исходных данных можно сделать покрасивее. Твоя ситуация крайне туманна. В одном случае тебе хватит фотошопа, в другом нужен спецсофт за десятки тысяч долларов, в другом хватит приложений из стора твоего телефона

>> No.126731  
File: 1456226684922.jpg -(4270975 B, 1920x2510) Thumbnail displayed, click image for full size.
4270975

>>126729

> Как ты снимал фото? Какие у тебя входные данные?

Что ты имеешь в виду?

> Ты снимал с разных положений или статично?

Возможно оба варианта

> Какой тип матрицы, какие у неё стояли настройки?

Предположим китайский noname, настроек нет

> Есть ли координаты матриц на входе?

Нет

> Фокусное расстояние, геометрия фотоприемника и объектива какая?

Данные недоступны

> На выходе ты хочешь что получить, панорамный снимок с перекрытиями, 3д, фотограмметрические координаты, просто снимок покрасивше?

Снимок с большем эффективным разрешением, допустим чтобы можно было разобрать текст.

>> No.126733  

>>126731

>Что ты имеешь в виду?

Формат? Ты ходил вокруг снимка или держал камеру ровно?

>Возможно оба варианта

Разные варианты-разные методы.

>Предположим китайский noname, настроек нет
>Нет
>Данные недоступны

Это печально. На самом деле, почти всё это можно вытащить из девайса, некоторые рав файлы хранят это в себе даже на обычных фотиках. Софтины обычно именно от этого отталкиваются, им нужен хоть какой-то набор начальных условий.

>Снимок с большем эффективным разрешением, допустим чтобы можно было разобрать текст.

Тренируй свою нейросеть и терпение в таком случае, что я тебе ещё скажу. Попробуй использовать фотошоп на одном снимке, это лучшее что можно посоветовать в данной ситуации.

>> No.126734  
File: 1456231922195.jpg -(496703 B, 900x787) Thumbnail displayed, click image for full size.
496703

>>126733

> Формат?

jpg

> Ты ходил вокруг снимка или держал камеру ровно?

Второе, небольшие смещения в наличии.

> Тренируй свою нейросеть и терпение в таком случае, что я тебе ещё скажу. Попробуй использовать фотошоп на одном снимке, это лучшее что можно посоветовать в данной ситуации.

Существование проектов вроде SPIDER как бы намекает на то, что темой все-таки кто-то занимается.

>> No.126735  

>>126734

>Существование проектов вроде SPIDER как бы намекает на то, что темой все-таки кто-то занимается.

Этой темой занимаюсь я, например. Склеить из снимков на которых ты не знаешь что будет и не зная что ты получил из камеры невозможно без ии или специалиста по фотошопу который хотя бы приблизительно может додумать что он видит на снимке.

>Второе, небольшие смещения в наличии.

Если у тебя есть что-то что ты можешь выделить как марку на фото, то можно приблизительно склеить картинку, только ты должен знать что это за марка чтобы вышло лучше, а не пшик. Ройся в рав файле, там должна быть шапка с данными которыми можно улучшить снимок.

>jpg

Воздержусь от комментариев, просто воспользуйся хотя бы пнг или тифом для начала, лучше рав или днг.

>> No.126737  
File: 1456236473811.png -(570712 B, 512x682) Thumbnail displayed, click image for full size.
570712

>>126735

> Если у тебя есть что-то что ты можешь выделить как марку на фото, то можно приблизительно склеить картинку

Ну как бы автосклеиватели панорам существуют давно и никаких дополнительных метаданных не просят.

> Воздержусь от комментариев, просто воспользуйся хотя бы пнг или тифом для начала, лучше рав или днг.

Не все камеры умеют отдавать что-то отличное от jpg/mjpg.

>> No.126745  

>>126709 >>126715 в модели есть одно опасное допущение: показания датчиков отражают мгновенное значение измеряемой величины в каждый момент времени. так что это ещё большой вопрос, можно ли повысить разрешение просто совмещением наборов, вернее, будет ли от этого толк больший, чем от интерполяции

>> No.126749  

>>126737

>Ну как бы автосклеиватели панорам существуют давно и никаких дополнительных метаданных не просят.
>автосклеиватели панорам

Дак может потому что это склеиватели панорам, а не субпиксельная обработка.

>Не все камеры умеют отдавать что-то отличное от jpg/mjpg.

Способ прочитать рав есть всегда.

>> No.126750  

>>126745
Это на самом деле больше зависит от того что ты снимаешь. Если плоскость и камера закреплена, то из нескольких снимков можно легко получить фото лучшего качества, примерно тот же результат что и от интерполяции. Если ты двигаешься в трёх осях, то у тебя уже пошла фотограмметрия, тут нужны какие-то метаданные для увеличения точности. Если объект объёмный и с острыми углами, то например на острых углах будут очевидные дефекты при интерполяции. Мало того, тут ещё может дурацкую шутку сыграть освещение

>> No.126752  

>>126750 то есть при таком подходе новой информации тоже не появляется, поскольку всё упирается в разрешение матрицы? увеличить разрешение готового изображения интерполяцией можно, но новыми деталями оно от этого не обрастёт

>> No.126754  
File: 1456260584679.jpg -(600639 B, 780x1100) Thumbnail displayed, click image for full size.
600639

>>126749

> Дак может потому что это склеиватели панорам, а не субпиксельная обработка.

Можно ведь, например, склеить грубо теми же средствами, что и панорамы, а точные данные получить банальным перебором вариантов.

> Способ прочитать рав есть всегда.

Как это сделать допустим для hi3516c без использования паяльника?

>> No.126761  

>>126752
Может обрасти если интерполяция совпадёт с реальной картинкой и ты что-то разглядишь.
>>126754

>Можно ведь, например, склеить грубо теми же средствами, что и панорамы, а точные данные получить банальным перебором вариантов.

Выйдет не лучше фотошопа

>Как это сделать допустим для hi3516c без использования паяльника?

Найти подробную документацию к сдк, порыться в ней на предмет слов "directly", "pixel" и т.д.

>> No.126763  
File: 1456302996545.jpg -(305969 B, 850x1169) Thumbnail displayed, click image for full size.
305969

>>126761

> Выйдет не лучше фотошопа

Лучше как минимум тем, что не потребует ни метаданных, ни оператора.

> Найти подробную документацию к сдк, порыться в ней на предмет слов "directly", "pixel" и т.д.

И ты имеешь прекрасную возможность убедится что там такого нет.

>> No.126765  

>>126754
На превьюшке показалось, что она собирается стрелять из кота.

>> No.126781  

>>126761 невозможно определить, из чего состоит один пиксель, так что не обрастёт

>> No.126799  
File: 1456421652168.jpg -(266707 B, 860x1214) Thumbnail displayed, click image for full size.
266707

>>126781
но можно узнать махонькую картинку по характеристике из нескольких пикселей. нейросети фтв.

>> No.126800  

>>126799
Тащемта там не нейросети а векторные алгоритмы вроде Хэмминга и прочих, которые либо сравнивают по блочным хешам, либо составляют векторную карту и ориентируются на процент погрешности. Нейросети тоже могут сравнивать и опознавать картинки (например, недавно было видео, где нейросеть подключили к вебкамере ноута, носили по улице, а она опознавала предметы на лету - "это река, это мост, это человек, это негр, это кафе" и тд), но пока они этим не занимаются, так как там много концептуальных проблем, а ещё они относительно медленные пока, вот.

>> No.126814  

>>126781
Возможно. Вот приведу тебе пример. Есть у тебя фото пустыни сверху разрешение 1м на пиксел, а посреди жёлтой пустыни стоит яркий зелёный кактус размером 0.5м. Этот кактус в итоге делает два твоих пиксела зеленоватыми. Разбил ты эти два пиксела на 4 например. У тебя получились 2 пиксела в серединке более зеленоватые, а пикселы по краям жёлтые. С точки зрения информации у тебя не поменялось ничего. С точки зрения человека, он уже начал на картинке видеть зелёную фигнюшку, на фоне пустыни он точно скажет что это кактус или куст. С буквами зачастую работает тот же принцип, человек знает буквы и сам у себя в голове достраивает нечёткую картинку. Поэтому чисто математическая склейка это хорошо, но будущее за нейросетями.

>> No.126821  

>>126799 из большего меньшее сделать можно всегда
>>126814

>он точно скажет что это кактус или куст

тем самым произведя типичную ошибку классификации. ту же ошибку сделает, например, клеточный классификатор, если вместо клетки ему подсунуть часовую шестерню. нейросеть — это такая хитрожопая статистика, она всегда что-нибудь да определяет, только вот разобрать её и сказать, как именно она это делает, ты уже не сможешь, поскольку содержательности в ней нет

>> No.126827  

>>126821

>тем самым произведя типичную ошибку классификации. ту же ошибку сделает, например, клеточный классификатор, если вместо клетки ему подсунуть часовую шестерню. нейросеть — это такая хитрожопая статистика, она всегда что-нибудь да определяет, только вот разобрать её и сказать, как именно она это делает, ты уже не сможешь, поскольку содержательности в ней нет

Я как бы с тобой согласен и не согласен одновременно. Безусловно для любого другого точного измерения это не годится, как и выдавать такой продукт условному заказчику будет не честно, потому что процент ошибки в таких фото всегда сохраняется. Но мы проводили сорт оф эксперименты английских учёных на самих себе. Пример с кактусом абсолютно реален и его опознали 100% опрошенных(выборка была на человек пять, сразу оговорюсь, это был скорее забавный эксперимент, чем серьёзная попытка что-то сделать). Людей точно также 100% отличали от столбов, их просто было хорошо различать после тупой апроксимации, даже велосипедиста чётко отличали от просто стоящего человека, я даже не знаю что там другого предложить. Человек при этом занимал треть исходного пиксела. Особенно хорошо это было видно на снимках сделанных ближе к вечеру, по теням отделяли даже типы кузовов машин. Я остался при мнении что я либо слишком глуп чтобы понять откуда у меня на снимке есть такая информация, либо наоборот слишком опытен в распознавании такой ерунды, так что делаю это почти безошибочно. Во втором случае источником информации для правильной обработки снимка является только мой опыт.

>> No.126846  
>Разбил ты эти два пиксела на 4 например.

Извините, что вклиниваюсь, но каким алгоритмом? Тем более именно на 2.

>> No.126848  

>>126814

> У тебя получились 2 пиксела в серединке более зеленоватые, а пикселы по краям жёлтые.

Ну и как алгоритм отличит один зелёный .5 метровый кактус от двухметровой жёлто-зелёной машины? Если даже снять второй снимок, ты ничего меньше метра не отличишь от другого предмета меньше метра.

>> No.127258  
File: 1457598225019.jpg -(16512 B, 573x130) Thumbnail displayed, click image for full size.
16512

к слову о нейросетях
http://gitxiv.com/posts/KpgzC4NZhE6CteK29/waifu2x-image-super-resolution-using-deep-convolutional

>> No.127263  

>>127258
а еще
http://www.boredpanda.com/inceptionism-neural-network-deep-dream-art/?afterlogin=savevote&post=419433&score=1

>> No.127273  

>>126800

> это человек, это негр
>> No.127519  

Тред не читай, сразу отвечай:
http://waifu2x.udp.jp/index.ru.html

>> No.127520  
File: 1458644807884.png -(945753 B, 824x1200) Thumbnail displayed, click image for full size.
945753

>>127519 красоты ей не прибавилось, новой информации тоже не появилось. зато есть МЫЛО

>> No.127525  

>>127520

Там же написано что работает только для скриншотов из китайских порномультиков.



Delete Post []
Password

[/b/] [/d/] [/tu/] [/a/] [/ph/] [/wa/] [/cg/] [/t/] [/p/]