System Architecture

AI-Enhanced MySQL Search Engine Architecture

Sync Test

Sync Test: This documentation was updated on December 2024 to test automatic synchronization from altus4/website to altus4/docs.

Altus 4 is built on a modern, scalable architecture that combines traditional database search with AI capabilities. This document covers the system design, patterns, and implementation details.

Quick Navigation

System Overview - High-level architecture
Core Components - Detailed layer breakdown
Design Patterns - Implementation patterns
Data Flow - Request processing flow
Security - Security implementation
Performance - Performance optimization

System Overview

Altus 4 follows a layered architecture pattern optimized for scalability, maintainability, and testability:

mermaid

graph TD
    A[Client Layer<br/>Web UI, Mobile Apps, Integrations] --> B[API Layer<br/>REST, Auth, Validation, Rate Limiting]
    B --> C[Service Layer<br/>Business Logic, Orchestration]
    C --> D[Data Layer<br/>MySQL, Redis, OpenAI API]

    style A fill:#e1f5fe
    style B fill:#f3e5f5
    style C fill:#e8f5e8
    style D fill:#fff3e0

Architecture Principles

Layered Design: Clear separation of concerns
Dependency Injection: Loose coupling between components
Async Processing: Non-blocking operations throughout
Event-Driven: Analytics and monitoring via events
Security-First: Authentication and authorization at every layer

Core Components

Client Layer

User-facing interfaces and integrations

Component	Description	Technology
Web UI	Primary user interface	Vue.js, Tailwind CSS
Mobile Apps	iOS/Android applications	React Native (future)
Third-party Integrations	API consumers	REST API clients

API Layer

Request handling and middleware pipeline

API Layer Components

Express.js Server: RESTful API endpoints with middleware pipeline
Authentication: API key-based authentication with tiered rate limiting
Validation: Zod schema validation for all endpoints
Rate Limiting: Redis-backed rate limiting per API key tier
Error Handling: Centralized error handling with structured responses
Request Logging: Comprehensive logging with correlation IDs

Service Layer

Business logic and orchestration

Service	Purpose	Key Features
SearchService	Search orchestration	Multi-database, AI integration
DatabaseService	MySQL operations	Connection pooling, query optimization
AIService	AI integration	OpenAI API, semantic search
CacheService	Performance optimization	Redis caching, analytics
UserService	User management	Authentication, profiles

Data Layer

Storage and external services

MySQLRedisOpenAI API

text

Primary data storage
- Full-text search indexes
- Relational data integrity
- Connection pooling

text

Caching & Analytics
- Search result caching
- Session storage
- Analytics data

text

AI Processing
- Semantic search
- Query optimization
- Result categorization

Design Patterns

1. Dependency Injection

Constructor-based dependency injection for loose coupling

typescript

export class SearchService {
  constructor(
    private databaseService: DatabaseService,
    private aiService: AIService,
    private cacheService: CacheService
  ) {}
}

Benefits

Improved Testability: Easy mocking for unit tests
Flexible Composition: Services can be easily swapped
Clear Dependencies: Explicit dependency relationships

2. Repository Pattern

Data access is abstracted through service interfaces:

typescript

interface IUserService {
  getUserById(id: string): Promise<User>;
  createUser(userData: CreateUserRequest): Promise<User>;
}

3. Strategy Pattern

Different search modes implemented as strategies:

typescript

type SearchMode = 'natural' | 'boolean' | 'semantic';

class SearchService {
  private getSearchStrategy(mode: SearchMode): SearchStrategy {
    switch (mode) {
      case 'natural':
        return new NaturalSearchStrategy();
      case 'boolean':
        return new BooleanSearchStrategy();
      case 'semantic':
        return new SemanticSearchStrategy();
    }
  }
}

4. Observer Pattern

Event-driven analytics and monitoring:

typescript

class SearchService extends EventEmitter {
  async search(request: SearchRequest): Promise<SearchResponse> {
    this.emit('search:started', request);
    const result = await this.performSearch(request);
    this.emit('search:completed', { request, result });
    return result;
  }
}

Data Flow

Search Request Flow

mermaid

graph TD
    A[Client Request] --> B[Authentication Middleware]
    B --> C[Rate Limiting Middleware]
    C --> D[Request Validation]
    D --> E[SearchController.executeSearch]
    E --> F[SearchService.search]
    F --> G[Cache Check<br/>Redis]
    F --> H[AI Processing<br/>OpenAI]
    F --> I[Database Query<br/>MySQL]
    G --> J[Result Processing & Enhancement]
    H --> J
    I --> J
    J --> K[Response Caching]
    K --> L[Analytics Logging]
    L --> M[JSON Response to Client]

Authentication Flow

mermaid

graph TD
    A[Registration/Login] --> B[Initial JWT Token<br/>Bootstrap Only]
    B --> C[API Key Creation]
    C --> D[Response with API Key]
    D --> E[Subsequent Requests with API Key]
    E --> F[API Key Verification Middleware]
    F --> G[Request Processing]

Legacy JWT Flow (Bootstrap Only)

mermaid

graph TD
    A[Login Request<br/>for API key creation only] --> B[UserService.loginUser]
    B --> C[Password Verification<br/>bcrypt]
    C --> D[JWT Token Generation]
    D --> E[Response with JWT + Refresh Token]
    E --> F[Use JWT to Create API Key]
    F --> G[JWT Verification Middleware]
    G --> H[API Key Creation Endpoint]

Security Architecture

Authentication & Authorization

API Keys: Long-lived credentials for B2B service integration
Tiered Permissions: Scoped permissions per API key (search, analytics, admin)
Environment Separation: Test and live API key environments
Role-based Access: User roles for administrative access control

Data Protection

Credential Encryption: Database credentials encrypted at rest
SQL Injection Prevention: Parameterized queries throughout
Input Sanitization: All user inputs validated and sanitized
HTTPS Only: TLS encryption for all API communications

Rate Limiting

Tiered Limits: Rate limits based on API key tier (free/pro/enterprise)
Per-API Key: Individual rate limiting per API key
Sliding Window: Redis-based sliding window rate limiting
Graceful Degradation: Informative error responses with upgrade suggestions

Performance Architecture

Caching Strategy

Multi-level Caching: L1 (in-memory) and L2 (Redis) caching
Cache Keys: Deterministic cache key generation based on request parameters
TTL Management: Different TTL values based on data volatility
Cache Invalidation: Event-driven cache invalidation on data updates

Database Optimization

Connection Pooling: Efficient MySQL connection management
Full-text Indexes: Optimized MySQL FULLTEXT indexes for search
Query Optimization: Analyzed and optimized search queries
Read Replicas: Support for read replica databases (future enhancement)

Parallel Processing

Concurrent Searches: Multiple database searches executed in parallel
Promise.allSettled: Graceful handling of partial failures
Worker Threads: CPU-intensive operations (future enhancement)

Scalability Considerations

Horizontal Scaling

Stateless Design: No server-side session state
Load Balancer Ready: Compatible with standard load balancers
Database Sharding: Support for multiple database connections

Vertical Scaling

Resource Monitoring: CPU and memory usage tracking
Connection Pool Tuning: Configurable database connection limits
Cache Size Management: Redis memory usage optimization

Microservices Migration Path

Current monolithic structure can be decomposed into microservices:

mermaid

graph TB
    subgraph "Current Monolith"
        M[Altus 4 API]
        M --> SS[Search Service]
        M --> US[User Service]
        M --> AS[AI Service]
    end

    subgraph "Future Microservices"
        MS1[Search Service]
        MS2[User Service]
        MS3[AI Service]
    end

Error Handling Architecture

Error Categories

Validation Errors: Invalid request data (400)
Authentication Errors: Invalid or missing tokens (401)
Authorization Errors: Insufficient permissions (403)
Not Found Errors: Resource doesn't exist (404)
Rate Limit Errors: Too many requests (429)
Service Errors: External service failures (502/503)
Internal Errors: Unexpected application errors (500)

Error Handling Strategy

typescript

// Custom error class
class AppError extends Error {
  constructor(
    public code: string,
    public message: string,
    public statusCode: number = 500,
    public details?: any
  ) {
    super(message);
    this.name = 'AppError';
}

// Centralized error handler
export const errorHandler = (
  error: Error | AppError,
  req: Request,
  res: Response,
  next: NextFunction
): void => {
  const statusCode = error instanceof AppError ? error.statusCode : 500;
  const code = error instanceof AppError ? error.code : 'INTERNAL_ERROR';

  logger.error('Request failed:', { error, request: req.body });

  res.status(statusCode).json({
    success: false,
    error: {
      code,
      message: error.message,
      details: error instanceof AppError ? error.details : undefined,
    },
    meta: {
      timestamp: new Date().toISOString(),
      requestId: req.headers['x-request-id'],
    },
  });
};

typescript

// Custom error class
class AppError extends Error {
  constructor(
    public code: string,
    public message: string,
    public statusCode: number = 500,
    public details?: any
  ) {
    super(message);
    this.name = 'AppError';
  }
}

// Centralized error handler
export const errorHandler = (
  error: Error | AppError,
  req: Request,
  res: Response,
  next: NextFunction
): void => {
  const statusCode = error instanceof AppError ? error.statusCode : 500;
  const code = error instanceof AppError ? error.code : 'INTERNAL_ERROR';

  logger.error('Request failed:', { error, request: req.body });

  res.status(statusCode).json({
    success: false,
    error: {
      code,
      message: error.message,
      details: error instanceof AppError ? error.details : undefined,
    },
    meta: {
      timestamp: new Date().toISOString(),
      requestId: req.headers['x-request-id'],
    },
  });
};

Monitoring & Observability

Logging Strategy

Structured Logging: JSON-formatted logs with consistent fields
Log Levels: Debug, info, warn, error with configurable levels
Correlation IDs: Request tracing across service boundaries
Performance Metrics: Response times and resource usage

Health Checks

Liveness Probe: /health - Basic application health
Readiness Probe: /health/ready - Service dependencies health
Deep Health Checks: Individual service component health

Metrics Collection

typescript

interface Metrics {
  requests: {
    total: number;
    successful: number;
    failed: number;
    averageResponseTime: number;
  };
  searches: {
    total: number;
    cacheHits: number;
    averageExecutionTime: number;
  };
  database: {
    activeConnections: number;
    queryCount: number;
    averageQueryTime: number;
  };
  cache: {
    hitRate: number;
    memoryUsage: number;
  };
}

Configuration Management

Environment-based Configuration

typescript

interface Config {
  server: {
    port: number;
    environment: 'development' | 'production' | 'test';
  };
  database: {
    host: string;
    port: number;
    username: string;
    password: string;
    database: string;
    connectionLimit: number;
  };
  cache: {
    host: string;
    port: number;
    password?: string;
  };
  security: {
    jwtSecret: string;
    jwtExpiresIn: string;
    bcryptRounds: number;
  };
  ai: {
    openaiApiKey: string;
    model: string;
    maxTokens: number;
  };
}

Configuration Validation

All configuration is validated at startup with detailed error messages for missing or invalid values.

Future Architecture Enhancements

Planned Improvements

Event Sourcing: Audit trail for all data changes
CQRS: Separate read/write models for better performance
Message Queues: Asynchronous processing for heavy operations
Circuit Breakers: Fault tolerance for external service calls
GraphQL API: Alternative API interface for flexible queries
WebSocket Support: Real-time search suggestions and results

Technology Roadmap

Database: Consider PostgreSQL for advanced full-text search features
Search Engine: Evaluate Elasticsearch integration for complex queries
Containerization: Docker and Kubernetes deployment
Monitoring: Prometheus/Grafana observability stack

This architecture provides a solid foundation for Altus 4's current needs while maintaining flexibility for future enhancements and scaling requirements.

System Architecture ​

System Overview ​

Architecture Principles ​

Core Components ​

Client Layer ​

API Layer ​

Service Layer ​

Data Layer ​

Design Patterns ​

1. Dependency Injection ​

2. Repository Pattern ​

3. Strategy Pattern ​

4. Observer Pattern ​

Data Flow ​

Search Request Flow ​

Authentication Flow ​

Legacy JWT Flow (Bootstrap Only) ​

Security Architecture ​

Authentication & Authorization ​

Data Protection ​

Rate Limiting ​

Performance Architecture ​

Caching Strategy ​

Database Optimization ​

Parallel Processing ​

Scalability Considerations ​

Horizontal Scaling ​

Vertical Scaling ​

Microservices Migration Path ​

Error Handling Architecture ​

Error Categories ​

Error Handling Strategy ​

Monitoring & Observability ​

Logging Strategy ​

Health Checks ​

Metrics Collection ​

Configuration Management ​

Environment-based Configuration ​

Configuration Validation ​

Future Architecture Enhancements ​

Planned Improvements ​

Technology Roadmap ​

System Architecture

System Overview

Architecture Principles

Core Components

Client Layer

API Layer

Service Layer

Data Layer

Design Patterns

1. Dependency Injection

2. Repository Pattern

3. Strategy Pattern

4. Observer Pattern

Data Flow

Search Request Flow

Authentication Flow

Legacy JWT Flow (Bootstrap Only)

Security Architecture

Authentication & Authorization

Data Protection

Rate Limiting

Performance Architecture

Caching Strategy

Database Optimization

Parallel Processing

Scalability Considerations

Horizontal Scaling

Vertical Scaling

Microservices Migration Path

Error Handling Architecture

Error Categories

Error Handling Strategy

Monitoring & Observability

Logging Strategy

Health Checks

Metrics Collection

Configuration Management

Environment-based Configuration

Configuration Validation

Future Architecture Enhancements

Planned Improvements

Technology Roadmap