Contacts

Processeur de traitement du signal numérique. Processeurs et processeurs de signal numérique (DSP) Application DSP

Signaux de processeur de signal numérique (Processeur de signal numérique - DSP) est un microprocesseur programmable spécialisé conçu pour manipuler le flux de données numériques en temps réel. Les processeurs DSP sont largement utilisés pour gérer les informations graphiques, les signaux audio et vidéo.

Quelconque ordinateur moderne Équipé d'un processeur central et de seulement quelques-uns - processeur de traitement de signal numérique (processeur de signal DSP - numérique). Le processeur central, évidemment, est un système numérique et traite des données numériques, donc au premier abord, il n'est pas clair la différence entre les données numériques et les signaux numériques, c'est-à-dire ces signaux qui gèrent les processus du processeur DSP.

Les signaux numériques, en général, attribuent naturellement tous les flux d'informations numériques formés lors des télécommunications. La principale chose qui distingue ces informations n'est pas nécessairement entrée dans la mémoire (et donc cela peut être inaccessible à l'avenir), il est donc nécessaire de le traiter en temps réel.

Le nombre de sources d'informations numériques est presque illimité. Par exemple, les fichiers téléchargés au format MP3 contiennent des signaux numériques, représentant en réalité un enregistrement sonore. Dans certains camcodeurs, des signaux vidéo sont numérisés et enregistrés au format numérique. Dans des modèles coûteux de téléphones sans fil et cellulaires, la voix est également convertie en un signal numérique.

Variations sur le sujet

Les processeurs DSP sont fondamentalement différents des microprocesseurs formant le bureau du bureau. Par la nature de ses activités, le processeur central doit effectuer des fonctions unificatrices. Il doit gérer le travail de divers composants matériels informatiques, tels que des lecteurs, des affichages graphiques et une interface réseau afin de garantir leur travail cohérent.

Cela signifie que les processeurs centraux des ordinateurs de bureau ont une architecture complexe, car ils doivent prendre en charge des fonctions de base en tant que protection de la mémoire, entier arithmétique, fonctionnement du point flottant et traitement des graphiques vectoriels.

En conséquence, un processeur central moderne typique prend en charge plusieurs centaines d'équipes garantissant l'exécution de toutes ces fonctions. Par conséquent, nous avons besoin d'un module de décodage des commandes, ce qui permettrait de mettre en place un dictionnaire complexe de commandes, ainsi que de nombreux schémas intégrés. En fait, ils doivent effectuer des actions définies par les équipes. En d'autres termes, un processeur typique dans le bureau contient des dizaines de millions de transistors.

Le processeur DSP, au contraire, devrait être un «spécialiste étroit». Sa seule tâche est de modifier le flux de signaux numériques et de le faire rapidement. Le processeur DSP consiste principalement en des circuits matériels à grande vitesse effectuant des fonctions arithmétiques et de manipuler des bits optimisés afin de changer rapidement de grandes quantités de données.

Pour cette raison, l'ensemble des commandes de DSP est beaucoup moins que cela processeur central ordinateur de bureau; Leur nombre ne dépasse pas 80. Cela signifie que le DSP nécessite un décodeur d'équipe léger et un nombre beaucoup plus petit de périphériques exécutifs. De plus, tous les appareils exécutifs doivent finalement prendre en charge les opérations arithmétiques hautes performances. Ainsi, un processeur DSP typique ne représente pas plus de plusieurs centaines de milliers de transistors.

En tant que hautement spécialisé, le processeur DSP s'oppose parfaitement à son travail. Le sien fonctions mathématiques Vous permettez de recevoir et de modifier en permanence le signal numérique (tel que l'enregistrement en mp3 ou en enregistrant un appel sur un téléphone portable), sans freiner la transmission d'informations et sans perdre. Pour augmenter bande passante Le processeur DSP est équipé de pneus de données internes supplémentaires offrant un transfert de données plus rapide entre les modules arithmétiques et les interfaces de processeur.

Pourquoi avez-vous besoin de processeurs DSP?

Les caractéristiques spécifiques du processeur DSP en termes de traitement de l'information en font un outil idéal pour de nombreuses applications. En utilisant des algorithmes basés sur l'appareil mathématique approprié, le processeur DSP peut percevoir le signal numérique et effectuer des opérations de convolution pour gagner ou supprimer ces propriétés de signal.

En raison du fait que dans les transformateurs DSP, de manière significative moins transistors que dans les transformateurs centraux, ils consomment moins d'énergie, ce qui leur permet d'être utilisés dans les produits de la batterie. Leur production est extrêmement simplifiée, ils se trouvent donc utilisés dans des appareils à faible coût. La combinaison d'une faible consommation d'énergie et de faible coût détermine l'utilisation de processeurs DSP dans téléphones portables Et dans les robots-jouets.

Cependant, le spectre de leur application est loin d'être limité. En vertu d'un grand nombre de modules arithmétiques, la présence de données intégrées sur la mémoire cristalline et des pneus de données supplémentaires peut être utilisée pour prendre en charge le traitement de multipéraptage. Ils peuvent compresser / déballer la "vidéo en direct" lors de la transmission sur Internet. Des processeurs DSP hautes performances similaires sont souvent utilisés dans des équipements pour organiser la vidéoconférence.

Inside DSP.

Le diagramme ci-dessous illustre la structure du noyau de processeur Motorola DSP 5680x. Des pneus internes distincts de commandes, de données et d'adresses contribuent à une forte augmentation de la bande passante du système informatique. La présence du bus de données secondaire permet au dispositif arithmétique de lire les deux valeurs, de les multiplier et d'effectuer le fonctionnement d'accumuler le résultat pour une horloge de processeur.

Stupé par inadvertance sur la vidéo de "puce et dip" # 1 traitement sonore numérique ADAU1701 | Projet ouvert | Démarrer
Puis «couvert» avec toutes sortes de souvenirs sur ce sujet. J'ai décidé de vérifier ce qui se passait à notre époque sur ce front, a constaté que beaucoup de bien et intéressant.

La qualité du traitement a considérablement augmenté, le prix est tombé de manière significative et le son DSP (traitement du signal numérique) frappe déjà sur notre maison! :)
Dans cette vidéo, la puce SigmadSp Adau1701 est considérée et j'ai décidé de voir ce que vous pouvez créer avec lui et j'ai été très impressionné par les possibilités.
En russe, vous pouvez en lire à leur sujet (). Pour moi, ce DSP vous permet de construire une normale système acoustique avec un croisement externe. Les possibilités du système sont inimaginement plus que ma sueur. Il vous permet de vous programmer un nouveau venu complet dans la programmation, mais de comprendre les composants sonores et la manière dont ils fonctionnent: filtres; croisements; Égaliseurs, etc. etc. Cette connaissance est nécessaire pour configurer tout cela.
C'est l'exemple d'un exemple de projet dans le programme de service et de programmation DSP:

Comme vous pouvez voir presque aucune "valeurs numériques", tout appelle "son".
Bien sûr, son ADC et DAC »est loin d'être hi-end, mais la chaîne hi-fi moyenne, mais pour la maison de cette qualité suffit, et les possibilités sont très élevées. Il est très bon que le DSP ait un double calcul Précision (56 bits) et il est défini par défaut..
Eh bien ... petite / incomplète diffrable Sang, maintenant la réalité.

Il y a des frais dans différentes versions:
Option 1
. Terminez les frais de test du fabricant coûte ~ 12-15 mille roubles Et vous permet d'éviter tout. IMHO Le plus grand avantage sur le reste est un SPDIF complet, c'est-à-dire et entrée numérique et sortie numérique Résultats. Vous permet également de déboguer des algorithmes "à la volée". Commandez "pour la colline" du site Web du fabricant.
Option 2.. Ceci est une disposition légèrement hachée de l'atelier - un ensemble de BM2114DSP. Il a toutes les entrées / sorties analogiques, mais le débogage est toujours "à la volée".
Coûte 4900 roubles.
Option 3.. Il s'agit de la version maximale simplifiée de l'utilisation de DSP à partir de "puces et de trempe" de leurs "forces électroniques" de labotorie.
Le kit s'appelle les processeurs de signal numériques RDC2-0027V1, un module de traitement du son numérique sur Sigmadsp Adau1701, Sigmastudio
C'est une variante avec le manque de programmation "à la volée". Créez un binaire, convertit et "verser" avec le "sifflet" dans le tableau ERROM. Le prend un peu de temps, mais enlève et nécessite une compréhension du processus. :)
Coût de paiement 950 roubles.

Oui, je vais clarifier, les frais après la programmation fonctionnent comme un périphérique indépendant !!! Ceux. PC n'est toujours pas nécessaire! Et au tableau, vous pouvez connecter la "Twist" (codeurs); boutons, etc., c'est-à-dire méthodes externes Les ajustements sont suffisants, pas nécessairement d'entrer dans le code DSP.
Le choix t'appartient...

Maintenant préoccupé ma liste de souhaits du passé. L'un des gros problèmes de filtres passifs est les distorsions de phase et plus la raideur du ralentissement du filtre, plus la distorsion de la phase est grande. À cause d'eux, il est extrêmement difficile de se débarrasser de différentes bandes de fréquences.
Les filtres numériques de données ne souffrent pas de cela et vous permettent de faire beaucoup à correspondre aux bandes de coupe. Mais il devient nécessaire d'utiliser au lieu d'un amplificateur - trois, un pour chaque plage de fréquences (une fois la colonne à 3 voies, puis les bandes 3 et les amplificateurs sont obtenus 3). Bien sûr, ils peuvent être optimisés par le pouvoir (par exemple, dans mon cas, il y aura une LC - 30W; SC - 20W; HF - 10W), mais ici sur les possibilités et une amateur, je pense que l'unification va gagner. :)

À la fin de la vidéo

Exemple comment combiner le "chiffre"

Le gars recueille un monstre sur deux DSP

Il n'y a pas si longtemps, grâce à de grands progrès dans le domaine de la transformation du son et des technologies informatiques, un tel concept que DSP - le traitement du signal numérique (traitement du signal numérique) a été fermement inclus dans notre conscience. Le traitement du signal numérique est un champ de technologie engagé dans des algorithmes informatiques en temps réel. DSP nous dit sur la possibilité de ce ou de cet émetteur-récepteur d'implémenter ce service via ses capacités techniques. Certains émetteurs-récepteurs modernes ont le traitement numérique de la réception et de la transmission. Il est prudent de dire que le traitement numérique fournit une qualité qui correspond aux nouvelles technologies et le temps que nous vivons.

Le traitement numérique par rapport à la radio amateur est le plus souvent utilisé dans le traitement du signal de l'éther, afin d'assurer une meilleure réception, éliminez les interférences d'accompagnement du transfert du correspondant. Ceci est fait lorsque vous travaillez avec tout type de communication, y compris numérique. À cette fin, un ordinateur avec une carte son intégrée (ZK) et le logiciel correspondant peuvent souvent utiliser. Toutefois, en temps réel, le signal est traité avec un délai et si le mode de réception est toujours tolérant, alors pendant la transmission - non.

SSB fonctionnant et utilisant du matériel informatique et des fonctionnalités logicielles dans le traitement du signal à partir du microphone, qui est connecté à la carte son de l'ordinateur (suivi du signal d'alimentation au modulateur équilibré émetteur-récepteur), le délai est très significatif. Nous parlons Il n'est pas facile d'améliorer le signal du microphone à un certain niveau à l'aide du CC, ainsi que sur l'utilisation de programmes de traitement de signal spécial en temps réel. La situation est encore plus aggravée lorsque vous travaillez avec des espèces numériques telles que AMTOR, PACTEUR, PAQUET, lorsque l'ordinateur est utilisé simultanément, par exemple, en tant que filtre à encoche et, avec le contrôleur TNC disponible à la station TNC, il fournit des types énumérés de types de travail. Le retard dans le traitement du signal dans l'ordinateur dans de tels cas n'est pas valide. Afin de vous débarrasser de ce problème, utilisez une carte audio AUDIGY-2 (par exemple, Audigy-2 24 bits 96 kHz).

En outre, cette carte son dispose d'un processeur d'effets intégré matériel, qui permet d'utiliser des capacités logicielles et matérielles, de traiter le signal en temps réel à un niveau suffisamment élevé, c'est-à-dire En mode de transmission, par exemple, dans des types de travail téléphonique - SSB, AM, FM - ont un bon égaliseur, un compresseur, un limiteur et un mode de réception - Filtre d'encoche, extension ou autre chose.

Tout cela est possible même avec ordinateur personnel de processeur de pentium 200 ... 500 MHz, bien que l'utilisation de machines plus puissantes soit accueillie, car il existe des caractéristiques encore plus grandes du traitement du signal utilisant logiciel - Branchez et des programmes appropriés, l'algorithme de traitement nécessitant des performances informatiques plus élevées.

Dans ce cas, les technologies modernes permettent de ne pas utiliser de dispositifs de traitement numérique coûteux externes, mais dans une certaine mesure pour imiter leur fonctionnement en utilisant pour cela. puissance de calcul Processeur central informatique et carte son. Cependant, il est possible avec des ressources informatiques vraiment très élevées. En utilisant ces technologies, il reste seulement d'installer le nœud d'accueil - l'interface entre l'émetteur-récepteur et l'ordinateur et utilisez avec succès la possibilité de ces derniers.

Payer pour un traitement de signal numérique approprié dans l'émetteur-récepteur ou l'utilisation d'un ordinateur, les radio-amateurs utilisent également des unités de traitement DSP externes. C'est une direction relativement nouvelle dans les amateurs.

Il s'agit d'un traitement numérique du signal utilisant des équipements modernes de haute technologie utilisées dans les studios de radiodiffusion et de musicaux, offrant une qualité et une naturalité absolument professionnelle du son. Ce sont des consoles de mélangeur de haute qualité, ainsi que toutes sortes d'égaliseurs multi-bandes analogiques (plus souvent paramétriques), de systèmes d'annulation de bruit - Porte antibruit, compresseurs, limiteur, processeurs multi-effets, permettant aux différents algorithmes de traitement du son.

Il convient de noter que DSP est concept général. Vous pouvez avoir un égaliseur DSP, un compresseur, d'autres périphériques et même un préampli de microphone. Avoir une fonction DSP dans l'émetteur-récepteur est une fonction, dispose d'un studio d'équipement DSP complet - ce sont des caractéristiques complètement différentes. Cela est vrai si dans les deux cas, le traitement mentionné est effectué à basse fréquence.

Fabricants célèbres de DSP Equipment - Behringer www.behringer.com, ALESIS www.alesis.com et d'autres - en ont une énorme liste, et une grande partie de celle-ci peut être appliquée avec succès par des radio-amateurs.

Chacun de ces dispositifs effectue sa tâche et, en règle générale, contient des ADC de précision 24 bits et des DAC (convertisseurs analogiques-numériques et numériques-analogues) dans ses deux canaux (convertisseurs analogiques-numériques et numériques-analogiques), fonctionnant sur La fréquence professionnelle de discrédit et ayant une gamme de fréquences de fonctionnement de 20 Hz ... 20 kHz.

Bref certificat

Convertisseurs analogiques-numériques et analogiques numériques. Le premier convertit un signal analogique en valeur numérique d'amplitude, la seconde effectue la transformation inverse.

Le principe de fonctionnement de l'ADC consiste à mesurer le niveau du signal d'entrée et à émettre le résultat sous forme numérique. À la suite du travail de l'ADC, le signal analogique continu devient une impulsion, tout en mesurant simultanément l'amplitude de chaque impulsion. Le DAC reçoit une valeur d'amplitude numérique à l'entrée et génère les impulsions de tension ou le courant de la valeur souhaitée, que l'intégrateur situé derrière elle (filtre analogique) se transforme en un signal analogique continu.

En tant que nouveau (investissement particulièrement exigeant d'argent), il a ses partisans et ses adversaires. Pour atteindre un niveau élevé de qualité, il est nécessaire de transmettre un filtre plus large de l'émetteur-récepteur SSB-3 KHz et non de 2,4 kHz ou de 2,5 kHz, mais cela ne va pas au-delà des règlements des communications radio amateurs en termes d'équipement. utilisé.

Aujourd'hui, rejeter le droit à l'existence de la direction dans le traitement du son à l'aide d'appareils supplémentaires ne peut être que paresseux, envieux ou celui qui ne souhaite pas les progrès et les nouvelles technologies.

HI-FI Audio au SSB est la haute qualité du traitement du signal NF en SSB, ou "SSB étendu" - expressions SSB étendues, souvent audible et expliquant partiellement l'activité de plus de 10 ans de radio amateurs du monde entier à une fréquence de 14178 kHz.

Voici la "table ronde" des amateurs de signaux de studio et de façons de les recevoir. Ceci est une table ronde, qui n'a pas de temps. Le travail est effectué presque des nuages. Dans le monde, il y a un peu plus de 100 amateurs radio actifs utilisant ces technologies ne sont pas très perturbés par QRM, ils ont déjà atteint un succès important pour l'équipement de leurs stations et avoir non seulement des amplificateurs de puissance d'émetteurs-récepteurs haut de gamme (classe souvent élevée), mais aussi les antennes directionnelles efficaces les plus importantes

Beaucoup sont entendus à presque tous les passages et parfois en son absence de projet de loi, W2ONV, du nouveau Jersey - la plus ancienne radio amateur et un grand spécialiste dans le domaine du traitement du son à l'aide d'appareils DSP externes ayant une puissance de 1,5 kW (maximum autorisé dans Les États-Unis) et deux canaux de vagues de quatre éléments SFazed, il a été presque toujours entendu en Europe pendant de nombreuses années à une fréquence de 14178 kHz. Les personnes travaillant sur cette "table ronde" - différents âges, surtout de 30 à 80 ans, et le ton dans une plus grande mesure préciser les amateurs de radio du groupe d'âge plus âgé et ce n'est pas un hommage à la génération plus âgée, il s'agit d'une déclaration du fait qu'ils ont un grand succès dans le domaine du traitement numérique, car ils possèdent connaissances suffisantes et équipement plus grave.

Radio Amateurs sur "14178" - Alimentées et calmes, entièrement enthousiastes qui sont toujours content de leur propre entreprise et leur fournissent toute l'aide d'une contribution importante au développement de la transformation du son eux-mêmes, des mêmes amateurs de radio, de placer des informations utiles Sur leurs pages Web sur Internet, beaucoup conviendront que John, NU9N, créé un site Web sur Internet, apporté une contribution énorme au développement de cette zone (www.nu9n.com), où il a publié un manuel pratique sur l'utilisation. Des dispositifs de traitement numérique externes, la séquence de leur connexion (question très importante) paramètres sur le site Web NU9N peut également être télécharger des échantillons de signaux DSP de nombreux amateurs radio pour les écouter assez intéressants.

Malheureusement, dans le plan quantitatif de la station de l'ancienne Union, 14178 kHz est très faible - Vasily, ER4Dx, Igor, Ew1mm, Sergey, Ew1DM, Sergey, RW3Ps, Victor, Ra9fif et Oleg, RV3AAJ (aucune autre donnée) affecte la Manque de financement supplémentaire L'acquisition d'équipements audio, ainsi que la mentalité des personnes - quand il n'y a pas de temps ni d'argent à faire à tout cela, cela signifie que c'est mauvais, cela signifie qu'il n'est pas nécessaire de évidemment, il devrait être axé sur le fait que toutes les directions des amateurs ont droit à la vie, que ce soit des compétitions, QRP (ou QRO), DX'ing et même l'absence de connaissances de morse, une langue étrangère et bien plus encore - c'est Aussi une "direction", et nous, hélas, à cela semble déjà être utilisé pour s'y habituer.

Nous souhaitons que les "jeunes" (10 ans pour la radio - un terme de petit succès) dans leur passe-temps acharné et tous ceux qui ont déjà obtenu des résultats dans d'autres domaines, je vous invite à rejoindre la communauté des signaux de studio, à la fin, Il n'y a rien de plus intéressant pour les débuts.

Cet article ouvre une série de publications dédiées aux processeurs de signalisation numériques multi-notes TMS320C6678. L'article donne vue générale sur l'architecture du processeur. L'article reflète le matériel pratique-pratique offert par les auditeurs dans le cadre de cours de formation avancés sur les "processeurs multicœurs du traitement du signal numérique des signaux de C66X par Texas Instruments" menée dans l'Université de génie radio de Ryazan State.

Les processeurs de signal numérique TMS320C66XX sont construits par l'architecture de Keystone et sont des processeurs de signal multicœurs hautes performances fonctionnant avec un point fixe et flottant. L'architecture Keystone est un principe de fabrication de systèmes multicœurs sur un cristal, ce qui vous permet d'organiser l'opération conjointe effective d'un grand nombre de noyaux DSP et de type RISC, des accélérateurs et des périphériques, avec une bande passante suffisante des données internes et externes. canaux de transfert, base des composants matériels: Navigateur multicore (contrôleur d'échange de données d'interface interne), Teranet (bus de transfert de données interne), contrôleur de mémoire partagé multicicore (contrôleur d'accès) et hyperlink (interface avec appareils externes sur la vitesse intracralique).

L'architecture du processeur TMS320C6678, le processeur le plus performant de la famille TMS320C66XX, figure à la figure 1. L'architecture peut être divisée en composants principaux suivants:

  • ensemble de noyaux de fonctionnement (corepack);
  • sous-système de travail avec la mémoire interne et externe générale (sous-système de mémoire);
  • périphériques;
  • coprocesseur de réseau (coprocesseur de réseau);
  • contrôleur de transfert interne (navigateur multicommode);
  • modules de matériel de service et Teranet de pneu interne.

Image 1. Architecture totale du processeur TMS320C6678

Le processeur TMS320C6678 fonctionne sur une fréquence d'horloge de 1,25 GHz. Le fonctionnement du processeur est basé sur un ensemble de noyaux d'exploitation C66X Corepack, dont le nombre et la composition dépendent du modèle spécifique du processeur. CSP TMS320C6678 comprend 8 noyaux de type DSP. Le noyau est un élément informatique de base et comprend des blocs informatiques, des ensembles de registres, des logiciels, des logiciels et une mémoire de données. La mémoire incluse dans le noyau est appelée locale.

En plus de la mémoire locale, il existe une mémoire générale pour tous les cœurs - la mémoire générale du processeur multicœur (mémoire partagée Multicore MSM). L'accès à la mémoire partagée est effectué via le sous-système de gestion de la mémoire (sous-système de mémoire), qui comprend également une interface de mémoire externe EMIF pour l'échange de données entre le processeur et les copeaux de mémoire externes.

Le coprocesseur de réseau augmente l'efficacité du processeur dans la composition de différents types de dispositifs de télécommunication, mettant en œuvre du type matériel pour cette sphère de tâche de traitement de données. Le fonctionnement du coprocesseur est basé sur l'acceptation des paquets de l'accélérateur de paquets (accélérateur de paquets) et de l'accepérateur de sécurité. La spécification du processeur répertorie l'ensemble des protocoles et des normes soutenus par ces accélérateurs.

Les dispositifs périphériques comprennent:

  • Serial Rapidio (Srio) Version 2.1 - Fournit le taux de transfert de données à 5 Gbaud par ligne avec le nombre de lignes (canaux) - à 4;
  • PCI Express (PCIe) Versions GEN2 - fournit le taux de transfert de données à 5 Gbaud par ligne avec le nombre de lignes (canaux) - à 2;
  • Hyperlien. - l'interface du pneu électrique qui permet de commuter les processeurs construits par l'architecture de Keystone directement les uns avec les autres et échanger contre l'intrréisme; Taux de transfert de données - jusqu'à 50 Gbaud;
  • Gigabit Ethernet (GBE) Fournit des taux de transfert: 10/100/1000 Mbps et est pris en charge par un accélérateur matériel communications de réseau (coprocesseur de réseau);
  • EMIF DDR3. - Interface de type mémoire externe DDR3; Il possède un bus de 64 bits, fournissant un espace mémoire adressable jusqu'à 8 Go;
  • EMIF. - l'interface de la mémoire externe d'usage général; Il a un bit de pneu 16 bits et peut être utilisé pour connecter 256 Mo Nand Flash ou 16 Mo ni flash;
  • TSIP (ports série télécom) - port série de télécommunication; Fournit des taux de transfert à 8 Mbps par ligne avec le nombre de lignes - à 8;
  • UART. - port série asynchrone universel;
  • I2c. - pneu de communication interne;
  • GPIO. - Intrée à usage général - 16 Conclusions;
  • Spi - interface série universelle;
  • Minuères (minuteries) - utilisé pour générer des événements périodiques.
Les modules matériels de service incluent:
  • module de débogage et de trace (débogage et trace) - vous permet de recevoir des outils de débogage d'un accès aux ressources internes du traitement de travail;
  • boot Rom (Boot Rom) - stocke le programme de chargement initial;
  • sémaphore matériel - sert un support matériel pour organiser le partage de processus parallèles pour ressources communes processeur;
  • module de gestion de l'alimentation - implémente le contrôle dynamique des modes de puissance des composants de processeur afin de minimiser la consommation d'énergie aux moments où le processeur ne fonctionne pas en pleine puissance;
  • schéma de fapc - Formulaires internes fréquences d'horloge processeur d'un signal de tacting de référence externe;
  • contrôleur d'accès direct de mémoire directe (EDMA) - Gère le processus de transfert de données, décharger les noyaux d'exploitation du CSP et être une alternative au navigateur multicore.
Le contrôleur de transfert interne (navigateur multicore) est un module matériel puissant et efficace responsable de l'arbitrage des données entre différents composants de processeur. Les systèmes multi-noyau sur le cristal TMS320C66XX sont des appareils très complexes et d'organiser l'échange d'informations entre tous les composants d'un tel dispositif, un bloc matériel spécial est requis. Navigator multicore permet aux noyaux, périphériques périphériques, les périphériques hôtes n'assument pas les fonctions de contrôle de l'échange de données. Lorsqu'un composant de processeur doit envoyer un éventail de données à un autre composant, il indique simplement le contrôleur, lequel et où transférer. Toutes les fonctions pour l'envoi lui-même et la synchronisation de l'expéditeur et du destinataire prennent le navigateur multicœur.

La base du fonctionnement du processeur multi-core TMS320C66XX de la position d'échange de données à grande vitesse entre tous les nombreux composants de processeur, ainsi que les modules externes, est le pneu interne de Teranet.

Dans l'article suivant, l'architecture du noyau de fonctionnement C66X sera discutée en détail.

1. Guide de programmation multicœur / SPAB27B - Août 2012;
2. TMS320C6678 Manuel de données Signal de prosesseur de Signal fixe et flottant à point variable / SPRS691C - Février 2012.

Processeur de signal DSP numérique (processeur de signal numérique)

CaractéristiquesDsp.

DSP sont des processeurs spécialisés pour les applications nécessitant une informatique intensive.
Si vous recherchez, par exemple, le processus de multiplication de deux nombres tout en conservant les microprocesseurs traditionnels, vous pouvez voir comment le temps de la machine est consommé: d'abord l'échantillonnage de la commande se produit (l'adresse de commande est définie sur le bus d'adresse), Ensuite, le premier opérande (l'adresse de l'opérande est défini sur le bus d'adresse.), l'opérande est transféré à la batterie, puis il existe un échantillon du deuxième opérande, etc. L'accélération de ce processus dans le processeur général est impossible en raison de la présence du seul bus d'adresses et du seul bus de données, ainsi qu'une banque de données unique. Compte tenu de cela, toutes les opérations d'extraction des opérandes de la mémoire, des échantillons de commande et de sauvegarder l'opérande sont effectuées de manière séquentielle à l'aide du même bus de données et de l'autobus d'adresses. En outre, si vous envisagez le fonctionnement de la sommation cyclique de la série arithmétique, vous pouvez voir qu'il n'y a pas de temps qu'il n'y a pas de temps pour la mémoire de la commande du premier cycle, avec la vérification des conditions de cycle (mètre) et revenir à la première équipe. De plus, les gros coûts improductifs existent lors de la transition vers un sous-programme et un retour (enregistrement et restauration des valeurs du registre de la pile) et avec de nombreuses autres opérations. Si vous considérez grande quantité Opérations mathématiques Lors du traitement du signal numérique, il devient évident que les pertes très sensibles sont inévitables dans la précision du calcul du calcul lorsque l'arrondi, qui ne peut aboutir au résultat total. Cela se produit en raison du même bit de tous les registres des processeurs à usage général.
Avec le traitement du signal numérique, tous ces coûts ne sont pas autorisés. Afin de surmonter cette pénurie de processeurs à usage général et de signaux numériques ont été développés (processeur de signal DSP-Digital).

Trente architecture de Harvard

Sa fonction consiste principalement dans le fait que, contrairement aux deux pneus familiers à nous: les pneus de l'adresse et du bus de données, ainsi que d'une banque de mémoire, le DSP dispose d'au moins 6-7 pneus différents et de 2-3 Bank de mémoire. Cette fonctionnalité est destinée à maximiser l'exécution de l'opération de multiplication avec la préservation du résultat, ce qui est sans aucun doute le plus consommé et l'intensité de ressources dans le traitement numérique des signaux. L'architecture DSP permet Pour un cycle de machine produire:

  • sélection de la commande via les pneus de bus d'adresses de bus et de bus de programme;
  • sélection de deux opérandes pour le fonctionnement de la multiplication via deux autobus d'adresse de données;
  • améliorer les opérandes en batteries à travers deux pneus de données;
  • opération de multiplication;
  • enregistrez le résultat dans la batterie.

Ainsi, l'architecture de Harvard d'essai vous permet d'effectuer presque toutes les opérations pour un cycle de la machine.
À titre d'exemple de l'efficacité de l'utilisation de la DSP lors de la mise en œuvre d'algorithmes de traitement de signal numériques, vous pouvez apporter le fait suivant: le temps d'achèvement de la transformée complexe de Fourier Fourier de 1024 points est de 20 ms pour 486DX2 66 MHz (32 bits) et 3,23 mc pour 24 bits 33 MHz DSP56001 Motorola ou Motorola 3.1 ms pour 32 bits 33 MHz DSP TMS320C30 avec des instruments de Texas arithmétiques flottants.
Cependant, comme déjà mentionné, les processeurs de signaux numériques ont des honneurs non seulement mesurés à la vitesse des opérations de multiplication / d'accumulation (MIPS - des millions d'équipes par seconde), mais également des caractéristiques telles qu'une séquence d'exécution du programme, des opérations arithmétiques et de l'adressage de la mémoire , Permettant de réduire au minimum les dépenses de temps improductif. En général, le DSP diffère d'autres types de microprocesseurs et de microcontrôleurs dans les cinq principales caractéristiques suivantes:

  • Arithmétique rapide.

DSP - Le processeur doit effectuer l'exécution des opérations de multiplication, la multiplication avec l'accumulation, le décalage cyclique, ainsi que les opérations arithmétiques et logiques standard.

  • Volume dynamique avancé pour une opération de multiplication / accumulation.

L'opération de calcul d'une certaine séquence de valeurs est fondamentale pour les algorithmes mis en œuvre sur DSP. Une protection de trop-plein est nécessaire pour éviter la perte de données.

  • Sélection de deux opérandes pour un cycle.

De toute évidence, pour la plupart des opérations effectuées par DSP, deux opérandes sont nécessaires. Ainsi, pour obtenir des performances maximales, le processeur doit pouvoir produire un échantillon simultané de deux opérandes, ce qui nécessite également la présence d'un système d'adressage flexible.

  • La présence de tampons cycliques matériels (intégrés et externes).

La vaste classe d'algorithmes mis en œuvre sur DSP nécessite l'utilisation de tampons cycliques. Prise en charge matérielle du retour cyclique du pointeur d'adresse ou de l'adressage modulaire réduit les coûts de non-production du temps de processeur et simplifie la mise en œuvre d'algorithmes.

  • Organisation de cycles et de branches sans perte de performance.

Les algorithmes DSP incluent de nombreuses opérations répétitives pouvant être implémentées sous forme de cycles. La possibilité d'organiser la séquence d'exécution du programme de code dans le cycle sans perte de performance est distinguée par DSP d'autres processeurs. De même, la perte de temps lors de l'exécution d'une opération de branche par état est également inacceptable lorsque le traitement numérique des signaux.
Cependant, il ne faut toutefois pas penser que DSP peut remplacer complètement les processeurs à usage général. En règle générale, les processeurs de signaux numériques ont un système simplifié de commandes qui ne permettent pas d'exécuter les opérations qui ne sont pas liées aux calculs mathématiques avec la même efficacité que les processeurs à usage général. Tenter de combiner dans une puissance de processeur dans les calculs mathématiques et la flexibilité des opérations d'un autre type conduit à une augmentation injustifiée du coût. Par conséquent, les DSP sont utilisés plus souvent sous la forme de coprocesseurs (mathématiques, graphiques, accélérateurs, etc.) avec le processeur principal ou en tant que processeur indépendant, si cela suffit.

Dsp.entreprisesMotorola.

Motorola produit actuellement trois familles de processeurs de signaux numériques. Ceci est la série DSP56100, DSP56000 et DSP96000. Tous les microcirces de la série sont basés sur l'architecture DSP56000 et diffèrent respectivement dans les bits (16, 24, 32 bits) et certains dispositifs intégrés. Ainsi, la compatibilité des microcirces des trois familles est atteinte. Toutes les entreprises DSP Motorola sont construites selon l'architecture d'essai identique décrite précédemment avec un grand nombre composants, ports, contrôleurs, banques de mémoire et pneus fonctionnant en parallèle afin d'atteindre une vitesse maximale.
Transfert de données Il se produit sur les pneus de données bidirectionnelles (un pour DSP56100 (XDB) et deux pour DSP56000 et DSP96000 (XDB et YDB)), le bus de données de programme (PDB) et un bus de données commun (GDB). De plus, DSP96000 dispose d'un bus d'accès direct (DDB) séparé). La transmission des données entre les pneus se produit via le Dispositif de gestion des pneus.
Adressage Il est réalisé sur deux pneus unidirectionnels: le bus de bus et autobus d'adresse de programme.
Unité de manipulation Bita Vous permet de gérer de manière flexible l'état de tout bit dans les registres et les cellules de mémoire. La présence d'une telle opportunité est un avantage par rapport aux autres utilisateurs de DSP.
Dispositif arithmétique et logique (AllU) effectue tous les arithmétiques et opérations logiques et a dans ses inscriptions d'entrée de composition, des piles, des registres d'expansion de la batterie (8 bits, permettant de 256 débordements sans perte de précision), un bloc de multiplication d'un bit parallèle avec préservation (MA), ainsi que des registres de décalage. Système de commande flexible vous permet. Pour effectuer ALU par cycle de commande de multiplication, multiplication avec la préservation du résultat, des opérations de résumé, de soustraction, de décalage et de logique. La caractéristique caractéristique du DSP de la société Motorola est la possibilité de doubler les registres d'entrée d'AllU et une augmentation de la présente manière de la décharge des nombres traités. Une autre caractéristique importante est la présence d'une opération de division, souvent absente des autres fabricants et une opération de multiplication remplaçable pour un nombre inversé, ce qui entraîne une perte de précision.
Unité de formation d'adresse Effectue tous les calculs liés à la définition des adresses en mémoire. Cette unité fonctionne indépendamment des autres blocs de processeur. Pour un cycle, deux opérations de lecture peuvent être effectuées à partir de la mémoire ou de l'une opération d'enregistrement. Le DSP de Motorola possède un système d'adressage puissant extrêmement puissant qui vous permet de produire presque toutes les manipulations avec des données pour une commande. Cette caractéristique importante est bénéfique pour DSP, fabriquée par la société, des analogues. L'adressage du module est pratique pour l'organisation de tampons en anneau sans vérifier la frontière, ce qui permet d'éviter le temps improductif. La possibilité de traiter l'inversion des bits significatifs facilite la mise en œuvre du BPF.
Bloquer Bureau Exécution programme Contient 6 registres, parmi lesquels Cycle d'adresse du pointeur et Contre-cyclesVous permettant d'organiser un support matériel pour l'organisation des cycles dans la société DSP Motorola, à laquelle des cycles de machine supplémentaires ne sont pas consacrés à la vérification des conditions de sortie du cycle et de modifier le compteur de cycle. Un certain nombre de répétitions sont clairement indiquées dans la commande ORGANISATION DO CYCLE.
La pile de systèmes est une partie distincte des 15 mots de RAM et peut stocker des informations sur 15 interruptions, 7 cycles ou 15 sorties dans le sous-programme. Les données de la pile sont lues dans un cycle, réduisant ainsi les coûts de non-production du temps de processeur.
La principale caractéristique distinctive de Motorola de DSP est la présence de tous les microcirces Émulateur intrachrystalvous permettant de déboguer des programmes sans utiliser de matériel supplémentaire. Par conséquent, il n'est pas nécessaire d'acheter des agents de débogage coûteux. L'émulateur vous permet d'enregistrer / lire des registres et des cellules de mémoire, définissant les points d'arrêt, l'exécution du programme étape par étape et d'autres actions en soumettant des commandes à un bus 4 câblé.
Pour réduire la consommation d'énergie aux moments où les calculs ne sont pas effectués, deux modes avec une consommation d'énergie réduite sont fournis: Arrêter.et Attendez.
Pour travailler, avec d'autres processeurs et des canaux de mémoire directe, une mémoire intégrée est fournie. Interface hôte.
Possédant toutes les propriétés ci-dessus nécessaires au traitement du signal numérique, le DSP de Motorola a un système de commande extrêmement puissant et flexible permettant à l'utilisateur de travailler facilement et efficacement avec des processeurs.

DSP96000 Famille

La famille DSP96000 a une architecture 32 bits et prend en charge les opérations de points flottants. Les microciricuits familiaux sont conçus pour systèmes informatiques Multimédia. Le DSP de cette série peut également fonctionner en tant que puces indépendantes, et à travers deux ports 32 bits indépendants peut être constamment échanger des données avec d'autres processeurs.
Les microcirces familiales sont dans leur composition 6 banques de mémoire, 8 pneus et 4 unités informatiques autonomes: AllU, une unité de contrôle du programme, une unité de génération d'adresses à double adresse et un contrôleur d'accès direct à double canal intégré.
Caractéristiques du microcircuit DSP96000:

  • 49,5 mips à 40 MHz
  • 60 mflops à 40 MHz, cycle 50 ns
  • Organisation 32 bits
  • 2 Banque Bank Memory Bank 512x32 bits
  • 2 Banque de mémoire de données 512x32 bits
  • Programmes RAM Programmes 1024x32 bits
  • booting Rom Volume 56 octets
  • mémoire externe adressable 2x232 mots de mémoire et de programmes de données 32 bits
  • Émulateur intégré
  • 2 canaux d'accès à la mémoire directe
  • Exchange de 2 canaux avec processeurs externes
  • cas avec 223 conclusions dans le logement PGA ou QFP

Dsp.entreprisesTexas.Instruments

Le DSP de cette société est représenté par les microprocrocesseurs suivants: TMS 32010, TMS 320C20, TMS 320C25, TMS 320C30, TMS 320C40, TMS 320C50.

Caractéristiques de l'architecture TMS320C25.

L'architecture TMS320C2X est basée sur l'architecture du TMS32010 - le premier membre de la famille des microprocesseurs DSP. De plus, l'ensemble de ses commandes chevauche l'ensemble des commandes de microprocesseur TMS32010, qui enregistre compatibilité logicielle bas.
Le microprocesseur TMS320C2X a une batterie et utilise l'architecture de Harvard dans laquelle les programmes de mémoire et de mémoire de données sont séparés en différents espaces d'adresses. Cela vous permet de chevaucher complètement l'appel et l'exécution de la commande. Le système de commandes comprend des commandes d'échange de données entre deux régions de mémoire. En dehors du microprocesseur de l'espace de mémoire de données et des programmes sont combinés dans le même bus afin de maximiser la plage d'adresses dans les deux domaines de la mémoire et de maximiser simultanément la quantité de contacts de sortie. À l'intérieur du microprocesseur, l'espace et l'espace de données sont affichés sur différents pneus pour augmenter la puissance du processeur et la vitesse de l'exécution du programme.
L'augmentation de la flexibilité de la conception du système est fournie par le cristal de deux grands blocs de mémoire RAM, dont l'une peut être utilisée à la fois en mémoire de mémoire et en mémoire de données. La plupart des commandes de processeur sont effectuées en un cycle de la machine en utilisant à la fois la mémoire externe des programmes d'échantillons rapides et l'utilisation. mémoire interne RAM. La flexibilité du microprocesseur TMS320C2X permet également de connecter une mémoire externe lente ou des périphériques à l'aide du signal prêt; Mais dans ce cas, les commandes sont effectuées pour plusieurs cycles.

Organisation de la mémoire

Sur le cristal TMS32020, il y a 544 mots 16 bits de la mémoire RAM, dont 288 mots (blocs B1 et B2) sont toujours affectés aux données et 256 mots (bloc B0) dans différentes configurations du processeur peuvent être utilisés soit comme mémoire de données ou en mémoire de programme. TMS320C25 En outre, il est muni d'une ROM déguisée (ROM), d'un volume de mots 4K et de TMS320E25 - la mémoire de mots 4K avec une effacement ultraviolette EPROM.
TMS320C2X est fourni par trois espaces d'adresses séparés - pour la mémoire de programmes, pour la mémoire de données et pour les périphériques d'E / S, comme indiqué à la Fig. 6.5. Ces espaces en dehors du cristal diffèrent à l'aide de -ps, -ds, -s signaux (pour les espaces de programme, les données, les entrées / la sortie, respectivement). Les blocs de mémoire B0, B1, B2 situé sur le cristal sont recouverts de la quantité de 544 mots de mémoire avec un accès arbitraire (RAM). RAM B0 (256 mots) est situé sur 4 et 5 pages de mémoire de données, s'il est attribué aux données, ou par adresses\u003e FF00 -\u003e FFFF, s'il fait partie de la mémoire du programme. Le bloc B1 (données uniquement) est situé sur 6 et 7 pages, et le bloc B2 occupe les 32 derniers mots 0 pages. Notez que la partie restante de la page est occupée par 6 registres adressables et la zone de sauvegarde; 1 - 3 pages sont également une zone de sauvegarde. Les zones de sauvegarde ne peuvent pas être utilisées pour stocker des informations, lors de la lecture de leur contenu ne sont pas définis.
La mémoire interne du programme (ROM), située sur un cristal de processeur peut être utilisée comme mots de mémoire de mots de 4k junior. Pour ce faire, le contact MP / * MC doit être servi un signal de bas niveau. Pour interdire l'utilisation du champ ROM interne sur MP / * MC, vous devez soumettre un niveau élevé.

Mémoire externe et interface d'E / S

Le microprocesseur TMS32020 prend en charge large éventail Systèmes d'interface. L'espace d'adressage des données, des programmes et des E / S fournit une conjugaison de la mémoire et des périphériques externes, ce qui augmente les capacités du système. L'interface de mémoire locale est composée de:

  • Pneu de données 16 bits (D0-D15);
  • TIRE D'ADRESSE 16 BIT (A0-A15);
  • adresse des espaces, des programmes et des entrées / sorties sélectionnés par des signaux (* DS, * PS et * est);
  • différents signaux de gestion du système.

Le signal R / * W contrôle le sens de la transmission et le signal * STRB contrôle la transmission.
L'espace d'E / S contient 16 ports pour les entrées et 16 ports de sortie. Ces ports fournissent une interface complète de 16 bits avec des périphériques de bus de données externes. Entrée / sortie jetable à l'aide des commandes IN et OUT est effectuée pour deux cycles de commande; Cependant, l'utilisation du compteur de répétition réduit le temps d'un accès au port jusqu'au 1er cycle.
L'utilisation d'E / S est simplifiée par le fait que l'entrée / la sortie est également effectuée, ainsi que l'attrait de la mémoire. Les périphériques d'E / S sont affichés dans l'espace d'adressage / sortie, à l'aide de l'adresse externe du processeur et du bus de données, de la même manière que la mémoire. Lors de l'adressage de la mémoire interne, le bus de données est dans le troisième état et contrôle les signaux de contrôle de l'état passif (élevé).
L'interaction avec des périphériques de mémoire et d'E / S à différentes vitesses est accompagnée d'un signal prêt. Lors de la communication avec des périphériques lents, TMS320C2X attend le périphérique jusqu'à ce que le périphérique achève son travail et signe le processeur à travers la ligne prête, après quoi le processeur continuera à fonctionner.

Dispositif logique arithmétique central

Le dispositif logique de l'arithmétique central (CALU) contient un registre de décalage de 16 bits, 16 x 16 multiplicateur parallèle, un dispositif à arithmétics-logique 32 bits (ALU), une batterie 32 bits et plusieurs registres de décalage supplémentaires situés comme à la sortie du multiplicateur Et à la sortie de la batterie.
Toute opération ALU est effectuée dans la séquence suivante:

  1. les données sont capturées à partir de la RAM au bus de données,
  2. les données passent à travers un registre de changement de vitesse et via Alu, dans lesquelles des opérations arithmétiques sont effectuées,
  3. le résultat est transmis à la batterie.

Une entrée à ALU est toujours connectée à la sortie de la batterie et la seconde peut recevoir des informations à partir du mode multiplicateur de produit (PR) ou de démarrage de la mémoire via un registre à décalage.

Opérations de convoyeur

Le convoyeur de commande consiste en une séquence d'opérations d'accès au bus extérieur qui se produisent lors de l'exécution de commandes. Convoyeur "Exécution de la prédèse-décodage" est généralement insensible à l'utilisateur, à l'exception de certains cas lorsque le convoyeur doit être interrompu (par exemple, lorsque la ramification). Pendant le fonctionnement du convoyeur, la préélection, le décodage et l'exécution de commandes sont indépendants les uns des autres. Cela permet aux commandes de se chevaucher. Donc, pour un cycle, deux ou trois équipes peuvent être actives, chacune à différentes étapes de travail. Par conséquent, il éteint un convoyeur à deux niveaux pour TMS32020 et trois niveaux pour TMS320C25.
Le nombre de niveaux du convoyeur n'affecte pas toujours la vitesse de l'exécution de la commande. La plupart des commandes sont effectuées dans le même nombre de cycles, quelles que soient les commandes sélectionnées dans la mémoire: externe, RAM interne ou ROM interne.
Le matériel de supplément existant sur le processeur TMS320C25 vous permet d'étendre le nombre de niveaux de convoyeur à trois, ce qui augmente la performance du processeur. Ces fonds incluent un compteur de pré-graveur (PFC), une pile micro-ondes 16 bits (MCS), un registre de commande (IR) et un registre de la file d'attente de commande (QIR).
Avec un convoyeur PFC à trois niveaux contient l'adresse de la commande suivante à prévenir. Dès que la préfraction est effectuée, l'équipe est chargée en IR. Si IR stocke une commande qui n'est pas encore remplie, la commande préexécue est placée dans qir. Après cela, PFC augmente sur 1. Une fois la commande actuelle exécutée, la commande qir sera surchargée en IR, pour une nouvelle exécution.
Compteur de commande (PC) contient l'adresse de la commande à remplir comme suit et n'est pas utilisée pour les opérations de capture.
Mais généralement, le PC est utilisé comme un pointeur vers la position actuelle dans le programme. Le contenu de PC augmente après chaque commande exécutée. Lorsqu'une interruption ou un appel de sous-programme se produit, le contenu du PC est placé sur la pile de manière à ce que, à l'avenir, vous puissiez revenir à la place souhaitée du programme.
Les cycles de pré-grade, de décodage et d'exécution du convoyeur sont indépendants de l'autre, il vous permet de chevaucher des commandes exécutables au fil du temps. Pendant n'importe quel cycle, trois commandes peuvent être actives simultanément, chacune à différentes étapes de l'achèvement.



Avez-vous aimé l'article? Partagez-le