Может это и не нужно, но если всё же как то анализировать заливаемые файлы (по расширению или содержанию), то представляется следующая картина: 
 Файлы со сканами :  
DJVU (скан, скан+OCR слой) (расширение .djv, .djvu) 
 TIFF (многостраничные) (расширение .tif, .tiff) 
 PDF (скан, скан+OCR слой) 
 CBR, CBZ (внутри любой допустимый формат),  
 CB7,CBT,CBA - нежелательны?? 
 JPEG, PNG и др. граф. одностраничные форматы - в любом виде недопустимы? 
 Файлы с эл. версиями:  
PDF (только OCR, изначально компьютерный) 
 FB2  DOC,RTF  CHM  HTML - нежелательно (из за необходимости прикреплять неск. доп. файлов - стили, иллюстрации и пр.)?  
 TXT - крайне нежелательно?