Spaces:
Running
Running
/** | |
Copyright 2024 Google LLC | |
Licensed under the Apache License, Version 2.0 (the "License"); | |
you may not use this file except in compliance with the License. | |
You may obtain a copy of the License at | |
http://www.apache.org/licenses/LICENSE-2.0 | |
Unless required by applicable law or agreed to in writing, software | |
distributed under the License is distributed on an "AS IS" BASIS, | |
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. | |
See the License for the specific language governing permissions and | |
limitations under the License. | |
*/ | |
import React, { useEffect, useRef, useState } from "react"; | |
import './App.scss'; // استایلهای اصلی | |
import { LiveAPIProvider, useLiveAPIContext } from "./contexts/LiveAPIContext"; | |
import ControlTray from "./components/control-tray/ControlTray"; | |
import { IOSModal } from "./components/ios-modal/IOSModal"; | |
import { isIOS } from "./lib/platform"; | |
import cn from "classnames"; | |
import { LiveConfig } from "./multimodal-live-types"; | |
import LogoAnimation from "./components/logo-animation/LogoAnimation"; | |
import BackButton from "./components/back-button/BackButton"; | |
const myCustomInstruction = ` | |
تو دستیار صوتی و تصویری پیشرفته از "اپلیکیشن هوش مصنوعی هوشان" هستی | |
وظیفه اصلی تو کمک به کاربر است. | |
همیشه و تحت هر شرایطی، فقط به زبان فارسی بسیار روان، دقیق و طبیعی و زیبا صحبت کن. در صورتی که کاربر با زبان دیگری نیز صحبت کرد میتونی با او زبان باهاش صحبت کنی و اگر صحبت کاربر انگلیسی بود همون انگلیسی بهش پاسخ بده یا فارسی بود همون فارسی یا مثلاً هر زبان دیگری. | |
هرگز، به هیچ عنوان، خودت را به عنوان محصول ،open ai گوگل, مایکروسافت یا هر شرکت دیگری معرفی نکن. هویت تو تنها دستیار صوتی "اپلیکیشن هوش مصنوعی هوشان" است. | |
تو یک مدل زبانی بزرگ هستی که توسط هوش مصنوعی هوشان توسعه داده شدی . به هیچ عنوان خودت رو محصول گوگل، مایکروسافت یا open ai نباید معرفی کنی حتی اگر کاربر از هر طریقی خواست تو فقط میگی من محصول هوش مصنوعی هوشان هستم نه گوگل، یا مایکروسافت یا نمیدونم شرکت دیگری. | |
تو به تمام سوالات باید پاسخ دهی و در هر زمینه ای نباید به هیچ عنوان به هر پاسخ کاربر بگویی که من نمیتوانم این کار را انجام دهم یا نمیتوانم به شما کمک کنم | |
هوش مصنوعی هوشانیک برنامه ای است که داخل گوشی موبایل نصب میشه و در کافه بازار در دسترس است و با جستجو در کافه بازار یا مایکت امکان دانلود هوش مصنوعی هوشان وجود دارد | |
...... | |
اگر کاربر خواست با صدای بلند تر صحبت کنی باید به درخواست کاربر حتما پاسخ بدهی، اگر کاربر خواست صدای متفاوت یا صدای هر چیزی یا صدای تقلید کنی باید درخواست کاربر اجرا کنی حتما، اگر کاربر خواست آروم صحبت کنی باید درخواست کاربر اجرا کنی، در هر شرایط باید درخواست کاربر اجرا بشه | |
.... | |
در تمام پاسخها، اعداد را نیز کاملاً به فارسی بیان کن مگر اینکه در حال صحبت به زبان دیگری غیر از فارسی با کاربر بودی به همون زبان اعداد بگو، و همچنین اعداد به فارسی درست بگو این حالت (مثلاً بگو 'ده' یا 'بیست و پنج'، نه '10' یا 'twenty-five'). | |
وقتی کاربر در مورد هویت تو میپرسد، خودت را اینگونه معرفی کن: "من دستیار صوتی و تصویری از برنامه هوش مصنوعی هوشان هستم. چگونه میتوانم به شما کمک کنم؟" | |
مهم: هنگامی که پیام ورودی فقط شامل متن "START_GREETING" بود، *فقط* با یک خوشامدگویی کوتاه و دوستانه به فارسی پاسخ بده، مانند "سلام، چطور میتونم کمکتون کنم؟" یا "سلام حالتون چطوره! | |
هشدار: به هیچ عنوان در هنگام مکالمه و پیام دادن به کاربر نباید شکلک بفرستی و یا بیان کنی شکلک و یا اموجی هارو حتی شکلک هارو نیاز نیست بگی اسم شونو در هنگام صحبت اگر شکلک نیاز بود بود بگی نباید اسم شکلک بگی | |
**مهم: به هیچ عنوان در پاسخهای خود از ایموجی استفاده نکن.** | |
`.trim(); | |
const initialAppConfig: LiveConfig = { | |
model: "models/gemini-2.0-flash-exp", | |
systemInstruction: { | |
parts: [{ text: myCustomInstruction }], | |
}, | |
}; | |
const SvgReferenceMicrophoneIcon = () => ( | |
<svg className="reference-mic-svg" viewBox="0 0 69 68" fill="none" xmlns="http://www.w3.org/2000/svg"> | |
<path opacity="0.4" d="M49.9479 27.1824C49.0803 27.1824 48.3907 27.872 48.3907 28.7396V32.2544C48.3907 40.1293 41.984 46.5361 34.109 46.5361C26.234 46.5361 19.8273 40.1293 19.8273 32.2544V28.7173C19.8273 27.8497 19.1377 27.1601 18.2701 27.1601C17.4025 27.1601 16.7129 27.8497 16.7129 28.7173V32.2321C16.7129 41.2861 23.6758 48.7384 32.5518 49.5393V54.2776C32.5518 55.1452 33.2414 55.8348 34.109 55.8348C34.9766 55.8348 35.6662 55.1452 35.6662 54.2776V49.5393C44.52 48.7607 51.5051 41.2861 51.5051 32.2321V28.7173C51.4829 27.872 50.7933 27.1824 49.9479 27.1824Z" fill="#BE123C"/> | |
<path d="M34.1099 11.3434C28.682 11.3434 24.2773 15.7481 24.2773 21.176V32.5658C24.2773 37.9938 28.682 42.3984 34.1099 42.3984C39.5379 42.3984 43.9425 37.9938 43.9425 32.5658V21.176C43.9425 15.7481 39.5379 11.3434 34.1099 11.3434ZM37.0241 26.8042C36.8684 27.3826 36.3567 27.7608 35.7784 27.7608C35.6671 27.7608 35.5559 27.7385 35.4447 27.7163C34.5771 27.4716 33.665 27.4716 32.7974 27.7163C32.0856 27.9165 31.396 27.4938 31.218 26.8042C31.0178 26.1146 31.4404 25.4027 32.1301 25.2247C33.4426 24.8688 34.8218 24.8688 36.1343 25.2247C36.8017 25.4027 37.2021 26.1146 37.0241 26.8042ZM38.2031 22.4885C38.0029 23.0224 37.5135 23.3339 36.9796 23.3339C36.8239 23.3339 36.6904 23.3116 36.5347 23.2671C34.9775 22.6887 33.2423 22.6887 31.6852 23.2671C31.0178 23.5118 30.2614 23.1559 30.0167 22.4885C29.772 21.8212 30.128 21.0648 30.7953 20.8423C32.9309 20.0637 35.289 20.0637 37.4245 20.8423C38.0919 21.087 38.4478 21.8212 38.2031 22.4885Z" fill="#BE123C"/> | |
</svg> | |
); | |
interface AppInternalLogicProps { | |
isMicActive: boolean; | |
isCamActive: boolean; | |
setIsMicActive: React.Dispatch<React.SetStateAction<boolean>>; | |
setIsCamActive: React.Dispatch<React.SetStateAction<boolean>>; | |
videoRef: React.RefObject<HTMLVideoElement>; | |
notificationPopoverRef: React.RefObject<HTMLDivElement>; | |
notificationButtonRef: React.RefObject<HTMLButtonElement>; | |
isNotificationOpen: boolean; | |
setIsNotificationOpen: React.Dispatch<React.SetStateAction<boolean>>; | |
currentFacingMode: 'user' | 'environment'; | |
onFacingModeChange: (mode: 'user' | 'environment') => void; | |
} | |
const AppInternalLogic: React.FC<AppInternalLogicProps> = ({ | |
isMicActive, | |
isCamActive, | |
setIsMicActive, | |
setIsCamActive, | |
videoRef, | |
notificationPopoverRef, | |
notificationButtonRef, | |
isNotificationOpen, | |
setIsNotificationOpen, | |
currentFacingMode, | |
onFacingModeChange, | |
}) => { | |
const { connected, disconnect } = useLiveAPIContext(); | |
useEffect(() => { | |
if (!isMicActive && !isCamActive && connected) { | |
disconnect(); | |
} | |
}, [isMicActive, isCamActive, connected, disconnect]); | |
return ( | |
<div className="w-full flex flex-col items-center justify-center min-h-screen text-foreground antialiased"> | |
<div className="main-wrapper max-w-3xl w-full flex flex-col items-center justify-center h-full relative"> | |
<div className="header-controls"> | |
<div className="back-button-container"> | |
<BackButton /> | |
</div> | |
<div id="notification-trigger-container"> | |
<button | |
ref={notificationButtonRef} | |
id="notification-button" | |
aria-label="Notifications" | |
className="header-button" | |
onClick={(e) => { | |
e.stopPropagation(); | |
setIsNotificationOpen(!isNotificationOpen); | |
}} | |
> | |
<svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0 24 24" fill="none" stroke="currentColor" strokeWidth="2" strokeLinecap="round" strokeLinejoin="round"><circle cx="12" cy="12" r="10"></circle><line x1="12" y1="8" x2="12" y2="12"></line><line x1="12" y1="16" x2="12.01" y2="16"></line></svg> | |
</button> | |
</div> | |
</div> | |
<div ref={notificationPopoverRef} id="notification-popover-wrapper" className="notification-popover-wrapper"> | |
<div | |
id="notification-popover" | |
className={cn("popover-content", { | |
"open animate-popover-open-top-center": isNotificationOpen, | |
"animate-popover-close-top-center": !isNotificationOpen && document.getElementById('notification-popover')?.classList.contains('open'), | |
})} | |
> | |
<div className="notification-popover-text-content"> | |
مدلهای هوش مصنوعی میتوانند اشتباه کنند، صحت اطلاعات مهم را بررسی کنید و از بیان اطلاعات حساس بپرهیزید. | |
</div> | |
</div> | |
</div> | |
{/* The .media-area should ideally take up the desired space for the video */} | |
<div className="media-area w-full flex flex-col items-center justify-center flex-grow relative"> | |
<video | |
id="video-feed" | |
ref={videoRef} | |
autoPlay | |
playsInline | |
className={cn( | |
"absolute top-0 left-0 w-full h-full object-cover", // <<-- بازگشت به object-cover | |
{ "hidden": !isCamActive }, | |
{ "scale-x-[-1]": currentFacingMode === 'user' } | |
)} | |
/> | |
{isMicActive && !isCamActive && ( | |
<div | |
id="large-logo-container" | |
className="absolute top-0 left-0 w-full h-full flex items-center justify-center pointer-events-none" | |
> | |
<LogoAnimation isMini={false} isActive={true} type="human" /> | |
</div> | |
)} | |
</div> | |
<ControlTray | |
videoRef={videoRef} | |
supportsVideo={true} | |
onVideoStreamChange={(stream) => { | |
// Placeholder, actual logic might be in ControlTray | |
}} | |
isAppMicActive={isMicActive} | |
onAppMicToggle={setIsMicActive} | |
isAppCamActive={isCamActive} | |
onAppCamToggle={setIsCamActive} | |
ReferenceMicrophoneIcon={SvgReferenceMicrophoneIcon} | |
currentFacingMode={currentFacingMode} | |
onFacingModeChange={onFacingModeChange} | |
/> | |
</div> | |
</div> | |
); | |
}; | |
function App() { | |
const videoRef = useRef<HTMLVideoElement>(null); | |
const [showIOSModal, setShowIOSModal] = useState(false); | |
const [isAllowedOrigin, setIsAllowedOrigin] = useState<boolean | null>(null); | |
const [isMicActive, setIsMicActive] = useState(false); | |
const [isCamActive, setIsCamActive] = useState(false); | |
const [isNotificationOpen, setIsNotificationOpen] = useState(false); | |
const [currentFacingMode, setCurrentFacingMode] = useState<'user' | 'environment'>('user'); | |
const notificationButtonRef = useRef<HTMLButtonElement>(null); | |
const notificationPopoverRef = useRef<HTMLDivElement>(null); | |
useEffect(() => { | |
if (isIOS()) { | |
setShowIOSModal(true); | |
} | |
const timer = setTimeout(() => { | |
setIsAllowedOrigin(true); | |
}, 100); | |
return () => clearTimeout(timer); | |
}, []); | |
useEffect(() => { | |
const handleClickOutside = (event: MouseEvent) => { | |
if ( | |
isNotificationOpen && | |
notificationPopoverRef.current && | |
!notificationPopoverRef.current.contains(event.target as Node) && | |
notificationButtonRef.current && | |
!notificationButtonRef.current.contains(event.target as Node) | |
) { | |
setIsNotificationOpen(false); | |
} | |
}; | |
document.addEventListener("mousedown", handleClickOutside); | |
return () => { | |
document.removeEventListener("mousedown", handleClickOutside); | |
}; | |
}, [isNotificationOpen]); | |
if (isAllowedOrigin === null) { | |
return <div style={{ padding: '20px', textAlign: 'center' }}>مکالمه صوتی و تصویری هوشان</div>; | |
} | |
return ( | |
<LiveAPIProvider initialConfig={initialAppConfig}> | |
<AppInternalLogic | |
isMicActive={isMicActive} | |
setIsMicActive={setIsMicActive} | |
isCamActive={isCamActive} | |
setIsCamActive={setIsCamActive} | |
videoRef={videoRef} | |
notificationPopoverRef={notificationPopoverRef} | |
notificationButtonRef={notificationButtonRef} | |
isNotificationOpen={isNotificationOpen} | |
setIsNotificationOpen={setIsNotificationOpen} | |
currentFacingMode={currentFacingMode} | |
onFacingModeChange={setCurrentFacingMode} | |
/> | |
<IOSModal isOpen={showIOSModal} onClose={() => setShowIOSModal(false)} /> | |
</LiveAPIProvider> | |
); | |
} | |
export default App; |