А вот хрен его знает. Может, никак. Если подойти к вопросу с точки зрения того, какую информацию снимки содержат, то может оказаться, что все снимки вместе не содержат достаточно информации, чтобы получить из них один более высокого качества. Например, на объект может быть нанесена некоторая надпись такого размера, что на всех снимках она видна как одно размытое пятно. Ни один из снимков не содержит достаточно информации, чтобы восстановить эту надпись. И все снимки вместе взятые тоже не содержат достаточно информации, чтобы восстановить надпись. Выходит, получить достаточное качество, чтобы надпись была видна, невозможно.
А вообще твой вопрос можно перефразировать так. Есть n датчиков. Каждый датчик со своим шумом (а шумы бывают разные, с разными параметрами; но в данном случае, допустим, что тип шума одинаков и параметры шума одинаковы для всех датчиков). На вход датчиков подаётся одинаковый сигнал f(t). Насколько возможно избавиться от шумов в этих условиях и получить исходный сигнал?
Вот теперь задача более-менее математически сформулирована. Шум от датчика i обозначим Ni(t). Тогда сигнал на выходе датчика i будет Oi(t) = f(t) + Ni(t). Теперь вопрос. Если просуммировать Ni(t) и поделить на количество датчиков, то получишь ли ты нечто близкое к нулю? Если да, то можно получить нечто близкое к f(t), просуммировав Oi(t) и поделив на n. Если нет, то всё сложнее.
Кстати, когда ты делаешь фото всё ещё сложнее. Исходный сигнал (свет, отражённый от объекта) помимо шума ещё получает пикселизацию, то есть твой сигнал становится более «квадратным».
Вот такие мысли у меня на этот счёт. Вообще, похоже на то, что эта задача из области обработки сигналов. Хрен его, погугли по этой теме что нибудь. Я в этой теме не эксперт.