Был же такой проект «Национальный корпус русского языка», вроде там так же были тексты из прессы, литературы, бытовой переписки. Это то же самое, что ли, на сибирском материале? Трудно представить, всё-таки, чтобы на основе просто исследования большого набора текстов настоящую энциклопедию сделали.