File size: 7,478 Bytes
cab60db
3ffebe8
 
 
 
ce76895
cab60db
396e0c2
30998ff
3ffebe8
ce76895
30998ff
3ffebe8
30998ff
3ffebe8
30998ff
3ffebe8
cab60db
30998ff
 
 
3ffebe8
 
 
 
 
 
 
 
 
 
 
 
 
cab60db
30998ff
3ffebe8
 
30998ff
f1e60b9
3ffebe8
 
 
 
 
 
 
 
 
 
30998ff
f1e60b9
3ffebe8
 
 
396e0c2
 
30998ff
f1e60b9
3ffebe8
 
 
 
30998ff
f1e60b9
3ffebe8
 
 
396e0c2
ce76895
 
30998ff
3ffebe8
 
30998ff
3ffebe8
 
 
cab60db
30998ff
396e0c2
 
 
 
30998ff
396e0c2
cab60db
30998ff
ce76895
 
 
 
 
30998ff
 
ce76895
 
 
30998ff
ce76895
30998ff
3ffebe8
30998ff
3ffebe8
 
 
ce76895
30998ff
ce76895
3ffebe8
71515bf
30998ff
71515bf
 
 
 
 
 
 
 
 
396e0c2
71515bf
 
f1e60b9
71515bf
 
 
 
396e0c2
71515bf
 
 
 
 
 
 
 
 
 
30998ff
71515bf
 
 
 
 
 
30998ff
71515bf
 
 
 
 
 
30998ff
71515bf
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
import streamlit as st
import numpy as np
import matplotlib.pyplot as plt
import random
from scipy.stats import entropy as scipy_entropy
import time

# --- НАСТРОЙКИ ---
# Длина последовательности и количество шагов симуляции
seqlen = 60
steps = 120
# Параметры минимальной и максимальной длины "бега" (сегмента с одинаковыми значениями)
min_run, max_run = 1, 2
# Торсионные углы для каждого нуклеотида ДНК: A, C, G, T
ANGLE_MAP = {'A': 60.0, 'C': 180.0, 'G': -60.0, 'T': -180.0, 'N': 0.0}
# Возможные нуклеотиды в последовательности
bases = ['A', 'C', 'G', 'T']

# --- БИОЛОГИЧЕСКИЕ ФУНКЦИИ ---
# Функция для нахождения локальных минимумов на графике торсионного угла (профиль ДНК)
# Бег - это последовательности одинаковых значений на графике (например, серии одинаковых углов)
def find_local_min_runs(profile, min_run=1, max_run=2):
    result = []
    N = len(profile)
    i = 0
    while i < N:
        run_val = profile[i]
        run_length = 1
        while i + run_length < N and profile[i + run_length] == run_val:
            run_length += 1
        if min_run <= run_length <= max_run:
            result.append((i, i + run_length - 1, run_val))
        i += run_length
    return result

# Функция для мутации последовательности ДНК (включает точечные мутации, инсерции, делеции и блочные перестановки)
def bio_mutate(seq):
    r = random.random()
    # Точечная мутация (меняется один нуклеотид)
    if r < 0.70:
        idx = random.randint(0, len(seq)-1)
        orig = seq[idx]
        prob = random.random()
        if orig in 'AG':
            newbase = 'C' if prob < 0.65 else random.choice(['T', 'C'])
        elif orig in 'CT':
            newbase = 'G' if prob < 0.65 else random.choice(['A', 'G'])
        else:
            newbase = random.choice([b for b in bases if b != orig])
        seq = seq[:idx] + newbase + seq[idx+1:]
    # Инсерция (вставка случайного блока нуклеотидов)
    elif r < 0.80:
        idx = random.randint(0, len(seq)-1)
        ins = ''.join(random.choices(bases, k=random.randint(1, 3)))
        seq = seq[:idx] + ins + seq[idx:]
        if len(seq) > seqlen:
            seq = seq[:seqlen]
    # Делеция (удаление случайного блока из последовательности)
    elif r < 0.90:
        if len(seq) > 4:
            idx = random.randint(0, len(seq)-2)
            dell = random.randint(1, min(3, len(seq)-idx))
            seq = seq[:idx] + seq[idx+dell:]
    # Блочная перестановка (инверсия случайного сегмента)
    else:
        if len(seq) > 10:
            start = random.randint(0, len(seq)-6)
            end = start + random.randint(3,6)
            subseq = seq[start:end]
            subseq = subseq[::-1]
            seq = seq[:start] + subseq + seq[end:]
    # Если последовательность короче нужной длины, добавляются случайные нуклеотиды
    while len(seq) < seqlen:
        seq += random.choice(bases)
    # Ограничиваем длину последовательности
    if len(seq) > seqlen:
        seq = seq[:seqlen]
    return seq

# Функция для вычисления автокорреляции профиля (анализ структурных зависимостей)
def compute_autocorr(profile):
    profile = profile - np.mean(profile)
    result = np.correlate(profile, profile, mode='full')
    result = result[result.size // 2:]
    norm = np.max(result) if np.max(result) != 0 else 1
    return result[:10]/norm

# Функция для вычисления энтропии профиля (мера хаоса или неопределенности)
def compute_entropy(profile):
    vals, counts = np.unique(profile, return_counts=True)
    p = counts / counts.sum()
    return scipy_entropy(p, base=2)

# --- STREAMLIT ИНТЕРФЕЙС ---
# Заголовок приложения
st.title("🧬 Эволюция ДНК-подобной последовательности")
st.markdown("Модель визуализирует мутации и анализирует структуру последовательности во времени.")

# Кнопка для запуска симуляции
if st.button("▶️ Запустить симуляцию"):
    # Инициализация случайной последовательности
    seq = ''.join(random.choices(bases, k=seqlen))
    # Списки для хранения статистик на каждом шаге
    stat_bist_counts = []
    stat_entropy = []
    stat_autocorr = []

    # Плейсхолдер для графика
    plot_placeholder = st.empty()

    
    # Симуляция изменения последовательности
for step in range(steps):
    if step != 0:
        seq = bio_mutate(seq)
    torsion_profile = np.array([ANGLE_MAP.get(nt, 0.0) for nt in seq])
    runs = find_local_min_runs(torsion_profile, min_run, max_run)
    stat_bist_counts.append(len(runs))
    ent = compute_entropy(torsion_profile)
    stat_entropy.append(ent)
    acorr = compute_autocorr(torsion_profile)

    fig, axs = plt.subplots(3, 1, figsize=(10, 8))
    plt.subplots_adjust(hspace=0.45)

    # Очищаем графики
    axs[0].cla()
    axs[1].cla()
    axs[2].cla()

    # График торсионного угла
    axs[0].plot(torsion_profile, color='royalblue', label="Торсионный угол")
    for start, end, val in runs:
        axs[0].axvspan(start, end, color="red", alpha=0.3)
        axs[0].plot(range(start, end+1), torsion_profile[start:end+1], 'ro', markersize=5)
    axs[0].set_ylim(-200, 200)
    axs[0].set_xlabel("Позиция")
    axs[0].set_ylabel("Торсионный угол (град.)")
    axs[0].set_title(f"Шаг {step}: {seq}\nЧисло машин: {len(runs)}, энтропия: {ent:.2f}")
    axs[0].legend()

    # График динамики числа 'биомашин'
    axs[1].plot(stat_bist_counts, '-o', color='crimson', markersize=4)
    axs[1].set_xlabel("Шаг")
    axs[1].set_ylabel("Число машин")
    axs[1].set_ylim(0, max(10, max(stat_bist_counts)+1))
    axs[1].set_title("Динамика: число 'биомашин'")

    # График автокорреляции
    axs[2].bar(np.arange(6), acorr[:6], color='teal', alpha=0.7)
    axs[2].set_xlabel("Лаг")
    axs[2].set_ylabel("Автокорреляция")
    axs[2].set_title("Автокорреляция углового профиля (структурность) и энтропия")
    axs[2].text(0.70, 0.70, f"Энтропия: {ent:.2f}", transform=axs[2].transAxes)

    # Отображаем график в Streamlit
    plot_placeholder.pyplot(fig)
    
    # Закрытие графика после отображения
    plt.close(fig)
    
    time.sleep(0.5)