"""
Модуль с парсером для HTML документов.
"""

import logging
import os
from typing import BinaryIO


from ...data_classes import ParsedDocument
from ..abstract_parser import AbstractParser
from ..file_types import FileType

logger = logging.getLogger(__name__)


class HTMLParser(AbstractParser):
    """
    Парсер для HTML документов.
    
    Примечание: На данный момент реализация является заглушкой.
    В будущем будет использоваться BeautifulSoup для обработки HTML.
    """
    
    def __init__(self):
        """
        Инициализирует парсер HTML документов.
        """
        super().__init__(FileType.HTML)
    
    def parse_by_path(self, file_path: str) -> ParsedDocument:
        """
        Парсит HTML документ по пути к файлу и возвращает его структурное представление.
        
        Args:
            file_path (str): Путь к HTML файлу для парсинга.
            
        Returns:
            ParsedDocument: Структурное представление документа.
            
        Raises:
            ValueError: Если файл не существует или не может быть прочитан.
            NotImplementedError: Метод пока не реализован полностью.
        """
        logger.debug(f"Parsing HTML file: {file_path}")
        
        if not os.path.exists(file_path):
            raise ValueError(f"File not found: {file_path}")
        
        filename = os.path.basename(file_path)
        
        # Создаем заглушку документа
        doc = ParsedDocument(
            name=filename,
            type="HTML"
        )
        
        # Полная реализация будет добавлена позже
        # (с использованием BeautifulSoup)
        logger.warning("HTML parsing not fully implemented yet")
        
        return doc
    
    def parse(self, file: BinaryIO, file_type: FileType | str | None = None) -> ParsedDocument:
        """
        Парсит HTML документ из объекта файла и возвращает его структурное представление.
        
        Args:
            file (BinaryIO): Объект файла для парсинга.
            file_type: Тип файла, если известен.
                Может быть объектом FileType или строкой с расширением (".html").
            
        Returns:
            ParsedDocument: Структурное представление документа.
            
        Raises:
            NotImplementedError: Метод пока не реализован полностью.
        """
        logger.debug("Parsing HTML from file object")
        
        if file_type and isinstance(file_type, FileType) and file_type != FileType.HTML:
            logger.warning(f"Provided file_type {file_type} doesn't match parser type {FileType.HTML}")
        
        # Создаем заглушку документа
        doc = ParsedDocument(
            name="unknown.html",
            type="HTML"
        )
        
        # Полная реализация будет добавлена позже
        # (с использованием BeautifulSoup)
        logger.warning("HTML parsing not fully implemented yet")
        
        return doc