File size: 965 Bytes
5f2649b
 
 
 
e0aca84
5f2649b
 
e0aca84
5f2649b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
import nltk
from nltk.tokenize import word_tokenize
import streamlit as st
# İlk kez kullanıyorsanız, aşağıdaki satırları çalıştırarak gerekli veri setlerini indirebilirsiniz:
nltk.download('punkt')

# Kötü kelime listesi oluşturma
bad_words = ["qehbe","sik","sikim","skm"]  # Bu listeye daha fazla kelime ekleyebilirsiniz

# Kötü kelimeleri tespit eden fonksiyon
def detect_bad_words(text, bad_words):
    # Metni küçük harflere dönüştür ve tokenize et
    words = word_tokenize(text.lower())
    
    # Kötü kelimeleri tespit et
    detected_bad_words = [word for word in words if word in bad_words]
    
    return detected_bad_words

# Kullanıcıdan metin alma ve fonksiyonu kullanma
user_text = st.text_area("Lütfen metni girin: ")
detected_words = detect_bad_words(user_text, bad_words)

if detected_words:
    st.write("Tespit edilen kötü kelimeler:", detected_words)
else:
    st.write("Hiçbir kötü kelime tespit edilmedi.")